纳米笼子可能在减少科学和工业的能源消耗方面发挥重要作用,俄勒冈州立大学的机器学习研究旨在加速这些卓越分子的部署。
在OSU研究的多孔有机笼分子能够选择性地捕获气体分子,可能在化学领域进行的无数气体分离中实现巨大的能量节约。
“这些多孔分子固体就像海绵一样,可以区别地吸收气体,”化学工程助理教授,ACS Central Science发表的一项研究的通讯作者Cory Simon说。
化学混合物的分离和净化共同造成了全球10%以上的能源消耗。
多孔笼分子具有其结构固有的纳米尺寸空腔,并且气体分子通过吸附被吸引并捕获在这些空腔内。
“但是每个笼子比其他笼子更容易吸附某些气体,这种性质可能使笼子更有效地分离气体混合物,”西蒙说。
然而,有数以千计的这些笼状分子可以合成 - 甚至可以制造其中一种,并在实验室中测试其性能需要数月 - 工业中需要数百种不同的化学分离; 因此需要一种计算方法来分类可能性并为手头的工作找到最佳分子。
西蒙利用了这样一种观点,即任何给定空腔的形状都是它最容易吸引的气体分子的原因。
Simon和学生Arni Sturluson,Melanie Huynh和Arthur York采用了一种“无监督”的机器学习方法,根据笼子的形状和吸附特性对笼子分子进行分类和分组。
无监督意味着计算机自己学习形状/属性关系; 没有任何标签来指示它。
“只需向算法显示数据,它就会自动在数据中找到模式 - 结构 - ”西蒙说。
研究人员使用了74个实验合成的多孔有机笼分子的训练数据集,每个分子都经过计算扫描,得到的每个3D“孔隙度”图像与CT扫描生成的图像相似。
“在这些3D图像的基础上,我们从面部识别算法,特征脸,灵感来源,将具有相似形状的腔体的笼子组合在一起,”他说。“使用奇异值分解,我们将笼子的3D图像编码成低维向量。”
西蒙用人脸的类比来解释这个过程。
“想象一下,你被迫将每个人的脸部映射到二维散点图中的一个点,同时尽可能多地保留关于面部的信息,”他说。“所以每个面只用两个数字描述,相似的面部在散点图中靠近。基本上,奇异值分解执行这种编码,但对于多孔笼分子。”