很有意思也很实用的项目Edit Banana -- 让不可编辑的内容也能编辑github.com/BIT-DataLab/Edit-Banana
上传一张图表的图片或pdf文件(自然是不可编辑的,除非p图),该项目可以将其转换为一张可编辑的DrawIO(XML)或svg或PPT文件。原理大概是先用 SAM 3分割图片,然后做OCR。由多模态 LLM 指导的提取过程。HOW I AI


很有意思也很实用的项目Edit Banana -- 让不可编辑的内容也能编辑github.com/BIT-DataLab/Edit-Banana
上传一张图表的图片或pdf文件(自然是不可编辑的,除非p图),该项目可以将其转换为一张可编辑的DrawIO(XML)或svg或PPT文件。原理大概是先用 SAM 3分割图片,然后做OCR。由多模态 LLM 指导的提取过程。HOW I AI

