基于分子子结构指纹的药物油水分配系数预测系统开发开题报告

 2022-05-15 22:42:03

1. 研究目的与意义

1.1研究背景

近年来现代生物迅速发展,油水分配系数是物质在正辛醇和水中的分配系数比值的对数值。logp值指某物质在正辛醇(油)和水中的分配系数比值的对数值。反映了物质在油水两相中的分配情况。logp值越大,说明该物质越亲油,反之,越小,则越亲水,即水溶性越好。亲脂性是药物开发中一个必不可少的参数,因为它既影响adme的性质,还影响着候选药物的靶向亲和力。药物在体内的溶解、吸收、分布、转运与药物的水溶性和脂溶性有关,即和油水分配系数有关。基于计算方法的药物油水分配可以有效减少药物化学实验在时间和经济成本。除此以外,对理解基于分子结构指纹的药物油水分配系数预测等生物学问题也是非常必要的。

1.2研究方法

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

结合国内外的研究发现,目前可用的logP计算方法表明,当应用于工业可用化合物的大型(约100k)内部数据集时,精度较低,即1个对数单位的RMSE。这主要是由于可用的测量对数表数据数量有限,无法充分覆盖内部收集的化学空间。本课题研究的内容主要包括:分子子结构指纹特征提取算法,基于自相关方差系数、子结构频率和离散小波分解函数的药物特征提取方法,机器语言的学习,利用多元线性回归、支持向量机和神经网络等模型的原理,对药物油水分配指数进行预测。

预期目标:改进算法,优化实验,提高模型预测的效果,构建一个药物分子指纹预测网站。功能包括:(1)添加,修改和删除药物信息功能。(2)药物分子指纹显示功能。(3)药物油水分配系数预测功能。该网站可调用后台已经构建好的预测模型,完成用户提交的计算任务,并反馈给用户。

3. 研究的方法与步骤

首先我们要先在训练阶段掌握分子子结构指纹特征提取算法、掌握基于自相关方差系数、子结构频率和离散小波分解函数的药物特征提取方法、掌握若干种分子指纹的编码方法,能够把任何已有化合物转换为分子指纹特征。

其次掌握机器学习基础知识,熟练使用相关算法工作、掌握多元线性回归、支持向量机和神经网络等模型的原理,并能熟练使用其中某种模型的相关软件包接口。

在药物指纹解析模块。对任意药物化合物,都能用若干种指纹编码方法表示分子指纹,并显示在系统中;

在实际操作是学会利用自相关方差系数、子结构频率和离散小波分解函数来提取指纹中的特征;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] Lombardo F.C.,Pasche V., Panic G., et al. Life cycle maintenance and drug-sensitivity assaysfor early drug discovery in Schistosoma mansoni[J]. Nature Protocols, 2019:DOI: 10.1038/s41596-41018-40101-y.[2] Chan H.C.S, Li Y., Dahoun T., et al. New Binding Sites, New Opportunitiesfor GPCR Drug Discovery[J]. Trends in Biochemical Sciences, 2019: DOI:10.1016/j.tibs.2018.1011.1011.[3] Ming C., Xi C., Jing W., et al. Polypharmacology of Berberine Based onMulti-Target Binding Motifs[J]. Frontiers in Pharmacology, 2018, 9: 801.[4] Himmelstein D.S., Lizee A., Hessler C., et al. Systematic integration ofbiomedical knowledge prioritizes drugs for repurposing[J]. Elife, 2017, 6:e26726.[5] El-Hachem N., Dma G., Ghoraie L.S., et al. Integrative CancerPharmacogenomics to Infer Large-Scale Drug Taxonomy[J]. Cancer Research, 2017,77(11): canres.0096.2017.[6] Yamanishi Y., Araki M., Gutteridge A., et al. Prediction of drug–targetinteraction networks from the integration of chemical and genomic spaces[J].Bioinformatics, 2008, 24(13): i232-i240.[7] Wishart D.S., Knox C., Guo A.C., et al. DrugBank: a knowledgebase fordrugs, drug actions and drug targets[J]. Nucleic Acids Research, 2008,36(Database issue): 901-906.[8] Wishart D.S., Feunang Y.D., Guo A.C., et al. DrugBank 5.0: a major updateto the DrugBank database for 2018[J]. Nucleic Acids Research, 2018, 46(D1):D1074-D1082.

5. 计划与进度安排

(1) 2022年1月10日—2022年1月30日

接受毕业设计任务,查阅资料并完成开题报告;

(2) 2022年2月1日—2022年2月8日

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版