AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下
AI搜索引擎再次进化。!
给这个AI一个主题,分分钟为你抛出一篇论文综述,还提供你自己的论文引用。
或者输入一个科学术语,AI可以快速生成这个术语的专属维基百科。
这个AI叫Galactica,是最新的科学语言开源模型,把AI变成科学生产力。
实现了主体的统一数学,物理,计算机这个AI都可以用
该模型一发布,迅速引发网友热议目前相关推文已被浏览近15万条,累计点赞,转发,引用也破5000
脸书的前技术官员也出来为它站台。
有网友亲身体验,写的文献综述看起来挺好的,甚至直呼:
接下来它还能产生新的想法吗。
其实写文献综述和制作维基百科只是GAL的一部分功能。除此之外,它还可以回答一些专业问题,编写科学代码,注释分子和蛋白质...
具体效果如何。来看看吧~
可以作为科学生产的工具。
说到科学生产力,肯定离不开论文的搜索不,高尔已经帮你解决了
它涵盖了五个科学学科:机器学习,数学,计算机科学,生物学和物理学。
选择好题目,然后在左边边框输入你想要的论文题目,右边的GAL会推荐最适合阅读的论文。
除了推荐论文,GAL还有一个更实用的功能:生成课堂笔记。
比如想做密度泛函理论的pre,但是懒得写讲稿,就GAL一下,分分钟搞定。
GAL也可以用来注释分子和蛋白质以下是GAL生成的RDKit操作手册
在一些细节上,GAL也处理的很严厉!
比如一些复杂的数学公式和代码你看不懂,留给GAL去解也没关系可以直接翻译成白话给你
不仅如此,它还可以实现数学公式与代码之间,或者不同类型代码之间的转换。
更重要的是,它具有简化公式和检查错误的功能。
你是怎么做到的。
GAL能实现如此复杂的功能,不得不提它的训练数据集。
根据官方消息,GAL在一种新型的高质量科学数据集NatureBook上接受训练,该数据集使模型能够使用科学术语,数学和化学公式以及源代码。
包括超过4800万篇论文,教科书和讲义,以及数百万种化合物和蛋白质,科学网站和百科全书等。
如此庞大的数据集,有两个问题。
第一个问题是如何管理这些高质量的数据集。为此,GAL采取了两个步骤:
前期训练包括针对具体任务的数据集,保证你在处理具体任务时能够更加专业。
另一个问题是:如何设计界面交互。
首先,如上所述,GAL可以支持不同类型的任务。
所以在设计界面交互的时候,对各种任务进行分类,不同的分类会支持不同类型的数据。
既然GAL拥有高度管理和高质量的科学数据集,那么它与其他模型相比如何。
直接上数据!
在推理上,GAL的优势很突出在数学上MMLU比龙猫的好在数学方面,它也优于PalM 540B和GPT—3 175B
GAL虽然没有经过通用数据集的训练,但是在BIG—bench上的表现仍然优于BLOOM和OPT—175B。
看完是不是也很痒。先说说吧!
门户网站:
参考链接:
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。