AI科学语言大模型火了，数学生物计算机样样行，编代码写综述也不在话下

来源：IT之家

发布时间：2022-11-16 13:43 阅读量：6796

AI搜索引擎再次进化。！

给这个AI一个主题，分分钟为你抛出一篇论文综述，还提供你自己的论文引用。

或者输入一个科学术语，AI可以快速生成这个术语的专属维基百科。

这个AI叫Galactica，是最新的科学语言开源模型，把AI变成科学生产力。

实现了主体的统一数学，物理，计算机这个AI都可以用

该模型一发布，迅速引发网友热议目前相关推文已被浏览近15万条，累计点赞，转发，引用也破5000

脸书的前技术官员也出来为它站台。

有网友亲身体验，写的文献综述看起来挺好的，甚至直呼:

接下来它还能产生新的想法吗。

其实写文献综述和制作维基百科只是GAL的一部分功能。除此之外，它还可以回答一些专业问题，编写科学代码，注释分子和蛋白质...

具体效果如何。来看看吧~

可以作为科学生产的工具。

说到科学生产力，肯定离不开论文的搜索不，高尔已经帮你解决了

它涵盖了五个科学学科:机器学习，数学，计算机科学，生物学和物理学。

选择好题目，然后在左边边框输入你想要的论文题目，右边的GAL会推荐最适合阅读的论文。

除了推荐论文，GAL还有一个更实用的功能:生成课堂笔记。

比如想做密度泛函理论的pre，但是懒得写讲稿，就GAL一下，分分钟搞定。

GAL也可以用来注释分子和蛋白质以下是GAL生成的RDKit操作手册

在一些细节上，GAL也处理的很严厉！

比如一些复杂的数学公式和代码你看不懂，留给GAL去解也没关系可以直接翻译成白话给你

不仅如此，它还可以实现数学公式与代码之间，或者不同类型代码之间的转换。

更重要的是，它具有简化公式和检查错误的功能。

你是怎么做到的。

GAL能实现如此复杂的功能，不得不提它的训练数据集。

根据官方消息，GAL在一种新型的高质量科学数据集NatureBook上接受训练，该数据集使模型能够使用科学术语，数学和化学公式以及源代码。

包括超过4800万篇论文，教科书和讲义，以及数百万种化合物和蛋白质，科学网站和百科全书等。

如此庞大的数据集，有两个问题。

第一个问题是如何管理这些高质量的数据集。为此，GAL采取了两个步骤:

前期训练包括针对具体任务的数据集，保证你在处理具体任务时能够更加专业。

另一个问题是:如何设计界面交互。

首先，如上所述，GAL可以支持不同类型的任务。

所以在设计界面交互的时候，对各种任务进行分类，不同的分类会支持不同类型的数据。

既然GAL拥有高度管理和高质量的科学数据集，那么它与其他模型相比如何。

直接上数据！

在推理上，GAL的优势很突出在数学上MMLU比龙猫的好在数学方面，它也优于PalM 540B和GPT—3 175B

GAL虽然没有经过通用数据集的训练，但是在BIG—bench上的表现仍然优于BLOOM和OPT—175B。

看完是不是也很痒。先说说吧！

门户网站:

参考链接:

。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

图片

市场情报

图片新闻

热门推荐