AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

来源:IT之家
发布时间:2022-11-16 13:43   阅读量:6796   

AI搜索引擎再次进化。!

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

给这个AI一个主题,分分钟为你抛出一篇论文综述,还提供你自己的论文引用。

或者输入一个科学术语,AI可以快速生成这个术语的专属维基百科。

这个AI叫Galactica,是最新的科学语言开源模型,把AI变成科学生产力。

实现了主体的统一数学,物理,计算机这个AI都可以用

该模型一发布,迅速引发网友热议目前相关推文已被浏览近15万条,累计点赞,转发,引用也破5000

脸书的前技术官员也出来为它站台。

有网友亲身体验,写的文献综述看起来挺好的,甚至直呼:

接下来它还能产生新的想法吗。

其实写文献综述和制作维基百科只是GAL的一部分功能。除此之外,它还可以回答一些专业问题,编写科学代码,注释分子和蛋白质...

具体效果如何。来看看吧~

可以作为科学生产的工具。

说到科学生产力,肯定离不开论文的搜索不,高尔已经帮你解决了

它涵盖了五个科学学科:机器学习,数学,计算机科学,生物学和物理学。

选择好题目,然后在左边边框输入你想要的论文题目,右边的GAL会推荐最适合阅读的论文。

除了推荐论文,GAL还有一个更实用的功能:生成课堂笔记。

比如想做密度泛函理论的pre,但是懒得写讲稿,就GAL一下,分分钟搞定。

GAL也可以用来注释分子和蛋白质以下是GAL生成的RDKit操作手册

在一些细节上,GAL也处理的很严厉!

比如一些复杂的数学公式和代码你看不懂,留给GAL去解也没关系可以直接翻译成白话给你

不仅如此,它还可以实现数学公式与代码之间,或者不同类型代码之间的转换。

更重要的是,它具有简化公式和检查错误的功能。

你是怎么做到的。

GAL能实现如此复杂的功能,不得不提它的训练数据集。

根据官方消息,GAL在一种新型的高质量科学数据集NatureBook上接受训练,该数据集使模型能够使用科学术语,数学和化学公式以及源代码。

包括超过4800万篇论文,教科书和讲义,以及数百万种化合物和蛋白质,科学网站和百科全书等。

如此庞大的数据集,有两个问题。

第一个问题是如何管理这些高质量的数据集。为此,GAL采取了两个步骤:

前期训练包括针对具体任务的数据集,保证你在处理具体任务时能够更加专业。

另一个问题是:如何设计界面交互。

首先,如上所述,GAL可以支持不同类型的任务。

所以在设计界面交互的时候,对各种任务进行分类,不同的分类会支持不同类型的数据。

既然GAL拥有高度管理和高质量的科学数据集,那么它与其他模型相比如何。

直接上数据!

在推理上,GAL的优势很突出在数学上MMLU比龙猫的好在数学方面,它也优于PalM 540B和GPT—3 175B

GAL虽然没有经过通用数据集的训练,但是在BIG—bench上的表现仍然优于BLOOM和OPT—175B。

看完是不是也很痒。先说说吧!

门户网站:

参考链接:

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

ad555
版权声明 - 广告服务 - 加入我们 - 不良信息举报-
市场情报网 版权所有
备案号:京ICP备16039483号