首页 > 行业资讯 > 加州大学伯克利分校J. Am. Chem. Soc.: ChatGPT化学助手用于文本挖掘和MOF合成预测

加州大学伯克利分校J. Am. Chem. Soc.: ChatGPT化学助手用于文本挖掘和MOF合成预测

时间:2023-08-12 来源: 浏览:

加州大学伯克利分校J. Am. Chem. Soc.: ChatGPT化学助手用于文本挖掘和MOF合成预测

暗梦飘逸醉月 科研任我行
科研任我行

keyanrenwoxing

聚焦于最新科技论文解读、DFT计算方法、科研趣事等。

收录于合集
#MOF/COF材料 8
#机器学习 19
2023年8月7日,J. Am. Chem. Soc.在线发表了加州大学伯克利分校Omar M. Yaghi课题组的研究论文,题目为《ChatGPT Chemistry Assistant for Text Mining and the Prediction of MOF Synthesis 》。

在此研究中,作者使用prompt engineering来指导ChatGPT从不同格式和风格的科学文献中自动挖掘金属-有机框架(MOF)合成条件的文本。这有效地缓解了ChatGPT产生信息幻觉的倾向, 这是以前在科学领域使用大型语言模型 (LLM) 具有挑战性的问题。 研究方法包括开发一个工作流程,实现三个不同的文本挖掘过程,由ChatGPT自己编程。 它们都 支持 解析、搜索、过滤、分类、 汇总 和数据统一,并在 人工 、速度和准确性之间进行不同的权衡 。研究部署该系统 提取26257个不同的合成参数,涉及来自同行评审研究文章的大约800个MOFs这个 过程结合了ChemPrompt Engineering 策略来指导ChatGPT进行文本挖掘,从而获得了令人印象深刻的精度、召回率和90–99%的F1分数。此外,利用文本挖掘建立的数据集,研究构建了一个机器学习(ML)模型, 在预测MOF实验结晶结果和初步识别MOF结晶中的重要因素方面的准确率超过87% 。研究还开发了一个可靠的基于数据的MOF聊天机器人,以回答有关化学反应和合成 过程 的问题。考虑到使用ChatGPT的过程以统一的格式可靠地挖掘和制表各种MOF合成信息,同时只使用不需要编码专业知识的叙述语言,研究预计ChatGPT化学助手将在其他各种化学子学科中非常有用。


图1  ChatGPT化学助手工作流程示意图

图2  精心设计的ChemPrompt图示

图3 18248个文本段嵌入的二维可视化

图4 由ChatGPT直接管理或通过ChatGPT编写Python代码管理的各种数据统一任务的示意图

图5  基于ChatGPT的文本挖掘过程的多方面性能分析

图6  分类模型在预测合成MOFs结晶状态中的性能

图7  MOF聊天机器人的集成工作流程


论文链接
Zheng, Z., Zhang, O., Borgs, C. et al. C hatG PT Chemistry Assistant for Text Mining and the Prediction of MOF Synthesis . J. Am. Chem. Soc. , 2023 . https://doi.org/10.1021/jacs.3c05819

【其他相关文献】

[1] Chung, Y.G., Camp, J., Haranczyk, M. et al. Computation-ready, experimental metal-organic frameworks: A tool to enable high-throughput screening of nanoporous crystals. Chem. Mater ., 2014 , 26, 6185−6192. https://doi.org/10.1021/cm502594j
[2]  Moghadam, P.Z., Li, A., Wiggin, S.B. et al. Development of a Cambridge Structural Database subset: a collection of metal-organic frameworks for past, present, and future. Chem. Mater ., 2017 , 29, 2618−2625. https://doi.org/10.1021/acs.chemmater.7b00441

版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
相关推荐