作為科學信息解決方案專業機構,美國化學文摘社(CAS)正與全球研究機構合作,應對COVID-19帶來的復雜而又快速變化的挑戰。作為美國化學會(ACS)的分支機構,CAS致力于踐行美國化學會的使命,持續開發、開放提供一系列資源(包括數據、工具、專業咨詢等)共同抗擊COVID-19。
CAS就其獨特的權威大數據進行挖掘整理,揭示數據間的關聯,現發布開放獲取“CAS COVID-19抗病毒候選化合物構效關系數據集”(CAS COVID-19 Antiviral Candidate SAR Dataset)。
點擊下載:

此數據集來源為報道COVID-19蛋白、病毒和疾病靶點的文獻、專利和其他公共資源,之前CAS在這些資源中提煉出9千多個物質構成了“CAS COVID-19抗病毒候選化合物數據集”,此次提供的29萬條構效關系(SAR)數據正是基于這些物質。研究人員無需支付費用即可利用這些數據進行研究、數據挖掘、機器學習和數據分析。
本數據集采用.CSV格式,包含超過29萬條構效關系數據,包括IC50、EC50和其他數值。能夠便捷地將CSV文件導入到電子表格工具,如Microsoft Excel。數據按列排列:cas_rn、蛋白質、治療用途、活性類型、活性值、活性單位、來源等。對于數據科學工具,例如可考慮使用Python編程語言的免費軟件SciKit-Learn、pandas library dataframes等,將數據集部署到機器學習中。
歡迎廣大師生使用!