星空体育app官方网站

星空app下载 谷歌北大联手学术版Banana爆火,论文图表100%精确生成
发布日期:2026-02-06 00:44    点击次数:133

星空app下载 谷歌北大联手学术版Banana爆火,论文图表100%精确生成

后果好到刷屏的 Nano Banana,学术特供版热乎出炉!

名字等于如斯直不雅——PaperBanana,给你每天都在头痛的 Paper 用上 Banana。(试图押韵 skr )

而且这一次是由谷歌北大强强联手打造。

知谈你思随即看后果,别急,三个官决策例这就给群众搬上桌。

在疏浚输入下,东谈主类绘制、原版 Nano Banana 与 PaperBanana 生成的论文插图对比如下:

抽象评估露馅,PaperBanana 在好意思不雅性、大意性与逻辑显著度上均全面优于原版。

而且它还能径直优化东谈主工绘制的插图,瞅瞅右边,是不是高等感一下就上去了。

此外,由于 PaperBanana 还提供代码出图功能  (即诳骗 Gemini-3-Pro 自动生成并实践 Python 可视化代码出图),是以它还能用来生成需要数值 100% 精确的多样图表。

好好好,既能拿持高等感,又不忘精确度,应该莫得学术东谈主不爱吧 ~

论文作家暗示,PaperBanana 为全自动生成可用于出书的插图铺平了谈路。

咱们但愿这个框架能成为联结复杂科学成见与高效视觉叙事的桥梁,赋能每一位探究者,用专科级的视觉说话显著呈现其发现。

而在看到自后果之后,一众网友也纷繁赞佩"学术插图"这个老浩劫总算是要被攻克了。

思思畴前的日子,真真实要落泪了 ~

探究东谈主员浮滥 4 个小时在 Figma 中绘制一张图,几乎令东谈主难以置信。

那么,学术版 PaperBanana 是如何真金不怕火造的呢?

一个不够,那就 5 个!

用一个模子生图若何够,目下都是多智能体皆上阵了。

没错,PaperBanana 背后等于5 个单干明确的智能体在起作用。

Retriever Agent(检索智能体):从顶会论文库中,找到与你要画的图限制、结构最一样的参考案例。

Planner Agent(盘算推算智能体):把论文笔墨描摹,回荡为包含悉数模块、逻辑的详备绘图阐明书。

Stylist Agent(立场智能体):回来学术审好意思轨范,给阐明书加上配色、排版等"好意思颜"轨范。

Visualizer Agent(可视化智能体):字据阐明书,径直绘制或写代码出图,产出初稿。

Critic Agent(批判智能体):查验图的对错与好意思不雅度,建议修改意见,轮回迭代 3 轮优化。

底下这张图显著展示了它们的责任经由:

划重心,连这张图亦然 PaperBanana 我方生成的。

论文作家暗示,这一过程参考了东谈主类制作论文插图的经由。

以制作一个模子架构图为例,常常探究东谈主员会先去望望顶会里雷同责任的图是若何画的,尊龙国际找找灵感和轨范。

这一步就对应了检索智能体的责任。

然后就需要字据参考来盘算推算我方的图该若何画,"我的步履有几个枢纽模块?"、"数据流和逻辑轨则是如何的?",在思清所相枢纽问题后,脑子里大略就有一幅架构蓝图了。

而到这一步还不是的确下笔的时刻,因为还需要结合我方的图以及之前看过的"顶会审好意思"轨范,来给蓝图加点设想感。

有了这两样东西(蓝图 + 审好意思),目下就不错的确出图了。

何况出完之后,探究东谈主员往交游需要查验一番,以确保出图正确无误。

若何样?是不是一环扣一环、且蹂躏逐个双应上了。

而在了解完 PaperBanana 的责任方式后,接下来的问题在于:

若何评估 PaperBanana 的生图后果?

实验步履及扫尾

对此,团队还有益构建了一个PaperBananaBench。该基准内容源自 NeurIPS 2025 ——

他们从 5275 篇论文中随机采样 2000 篇,经过滤、东谈主工校验后,得到 584 个灵验样本,然后将其平分为 292 个测试样本和 292 个参考样本。

这 292 个参考样本,每一个都索要了圆善的(S, C, I)三元组:

S(源高下文):描摹步履的文本,如论文步履论章节;

C(传达意图):图的标题 / 阐明,星空app注册登录如"咱们的框架概述";

I(参考图像):论文中实质使用的、高质料的对应图表。

参考样本集组成了一个高质料的"学术插图数据库",主要供检索智能体进行查询和匹配。

{jz:field.toptypename/}

而与之对应的 292 个测试样本,在评估时则仅提供 S、C 当作输入。其对应的 I 当作笼罩的轨范谜底,不参与生成过程,仅用于最终的质料比对与评分。

准备到这里,接下来等于具体生成和评估了。

裁判方面,他们给与了" VLM-as-a-Judge "(大模子当裁判)的评估范式——

让弘大的视觉说话模子(如 Gemini-3-Pro)当作评委,将 PaperBanana 生成的图与测试皆集笼罩的轨范谜底 I 进行逐项对比。

对比的维度主要有四个:至意性、大意性、可读性、好意思不雅性。

若 PaperBanana 推崇优于轨范图得 100 分,劣于得 0 分,持平得 50 分,最终盘算推算总分。

而实验扫尾标明,PaperBanana 在悉数维度上全面卓越了传统的单模子径直生成(Vanilla)等基线步履。

举座性能碾压:总分相对基线种植了 17.0%。其中,大意性种植最为显贵,高达 37.2%,阐明它生成的图逻辑更干净、重心更杰出;可读性(+12.9%)和好意思不雅性(+6.6%)也有大幅越过。

得回东谈主类盲测招供:在匿名的东谈主类盲测中,探究员有 72.7% 的情况以为 PaperBanana 生成的图比基线模子更好。

统计图表推崇优异:在需要高精度的统计图表任务中,PaperBanana 的"代码生成模式"在数值至意性上与东谈主类水平十分,而大意性和好意思不雅性以致后发先至。

这里需要阐明,在生成图表方面,PaperBanana 有两种模式:

一种是代码生成模式(默许)。让 Gemini-3-Pro 这类模子自动写 Python 可视化代码(如 Matplotlib),再驱动代码出图。优点是不错保证数值透顶准确,合适需要严格精度的场景。

另一种是径直生图模式(可选方式)。跳过代码,让图像生成模子径直字据文本描摹生成图表。优点是视觉后果更顶,但数值容易出现幻觉问题。

左图径直生图模式下,红框圈选出来的等于一些谬妄问题,而右侧的代码生图模式彰着无误,但好意思不雅度略逊。

终末的消融实考据明,检索参考、立场优化、批判迭代这三个设施统筹兼顾,它们共同保证了最终图像的"准确"与"面子"。

不外也需要辅导,PaperBanana 目下仍有一些局限性,比如它当作生图还无法裁剪,同期在许多细节至意度方面仍比不上东谈主类手责任业。

是以,更保障的作念法偶然是,让它帮你优化畴前绘制过的图。

不才面这套"手图转念"经由下,许多图都能变得更好意思不雅、更高等……诚然也更容易入顶会的眼(doge)。

谷歌 x 北大联手打造

终末先容下 PaperBanana 背后的团队。

一共 7 东谈主,不错显著分红两拨——

一拨来自北大,主要提供 NLP 与多模态和谐的学术根基;另一拨来自 Google Cloud AI Research,雅致多模态系统与工业化视角。

签字第一的 Dawei Zhu(兼通信作家),本硕博均就读于北大,现为北大四年齿博士生。

{jz:field.toptypename/}

他重心探究长高下文建模和多模态数据,之前在微软亚洲探究院实习过,目下是 Google Cloud AI Research 学生探究员,PaperBanana 亦然他在谷歌时期参与的面孔。

借着北大这条线,另外两位来自北大的离别是 Xiyu Wei 和 Sujian Li(兼通信作家)。

Sujian Li 目下是北大盘算推算机学院长聘副教训,亦然 Dawei Zhu 的博导,主要探究当然说话科罚、信息抽取等。

而 Xiyu Wei 可能仍是学生,目下只可看到 TA 和 Dawei Zhu 协作过一篇对于拓展高下文的论文。

而其他几位来自 Google Cloud AI Research 的离别是:

雅致东谈主 Tomas Pfister、高等探究科学家 Yale Song、探究科学家 Rui Meng 和 Jinsung Yoon(兼通信作家)。

限制目下,PaperBanana 已在开源社区 GitHub 揽获上千 star,感酷爱酷爱不错赓续关怀。

面孔主页:

https://dwzhu-pku.github.io/PaperBanana/

论文:

https://arxiv.org/abs/2601.23265

GitHub 地址:

https://github.com/dwzhu-pku/PaperBanana

参考相连:

[ 1 ] https://x.com/AlphaSignalAI/status/2018815238829928711

[ 2 ] https://x.com/dwzhu128/status/2018405593976103010

—  宽宥 AI 家具从业者共建  —

� �「AI 家具常识库」是量子位智库基于弥远家具库跟踪和用户步履数据推出的飞书常识库,旨在成为 AI 行业从业者、投资者、探究者的中枢信息要津与决策复古平台。

一键关怀 � � 点亮星标

科技前沿进展逐日见



友情链接:

Copyright © 1998-2026 星空体育app官方网站™版权所有

mrmbc.com 备案号 备案号: 

技术支持:®星空体育  RSS地图 HTML地图