开题报告------新精神活性物质质谱数据库的开发
- 选题依据
现代社会,以鸦片和海洛因为代表的第一类毒品,以甲基苯丙胺为代表的毒品仍未被控制,第三代毒品,也就是新精神活性物质悄然泛滥。由于犯罪分子往往为了逃避法律责任而经常对毒品结构进行改造,因此结构变异快,给监管带来了难度。现在的检测方法往往都是“目标”型的,仅能对一模一样的结构进行监测,而不能对相似结构的化合物进行定性。本研究主要是建立基于质谱数据的新精神活性物质识别系统,为打击高技术犯罪提供法庭依据,有重大社会意义。
- 综述
(一)新精神活性物质
新精神活性物质,英文名为new psychoactive substances(NPS),也被称为“legal high”或者“designer drug”。联合国禁毒署(United Nations Office on Drugs and Crime, UNODC)对其定义为:以纯品或者制剂的形式被滥用,对公共健康造成威胁,并且没有在1961年《麻醉品单一公约》和1971年《精神药品公约》中被管制的化学品[1]。NPS可以分成九类,分别为合成大麻素类,合成卡西酮类,苯乙胺类,哌嗪类,色胺类,苯环利啶和氯胺酮类,氨基茚满类,植物类,芬太尼类。
(二)质谱智能解析系统
智能质谱(intelligent mass spectrometry),也称计算质谱(computational mass spectrometry),指的是利用计算方法自动化处理质谱数据[2]。早期智能质谱的应用主要集中于处理蛋白组学数据[3],而后慢慢发展到DNA和RNA[4-5],聚糖[6],合成高分子[7]乃至小分子化合物[8]的解析。
质谱离子源最早多为EI模式,电离能为70eV最常见,然而EI模式下分子离子峰丰度很小甚至看不见。后续发展的“软”电离,即ESI模式,结合串联质谱,比如CID,能够提供更多的信息,分子离子峰也更加明显,但是由于碰撞能常常不同,CID重现性比EI要差。EI和ESI是最为经典的两类电离方式。而现在也发展出MALDI,APCI,APPI等多种电离模式,因此即使是同一化合物谱图之间也有一定程度变异。一个好的智能质谱算法应该是对不同的模式兼容的,这是一个很大的挑战[2]。
智能质谱对于化合物结构的解析主要分为已知物和未知物的解析两类。已知物的解析主要包括谱库的搜寻以及按照同位素峰来确定分子式两方面,此类不在本文讨论范围[2]。本文主要讨论未知结构的解析。众所周知,仅仅凭借质谱难以将一个化合物的准确结构解析出来,我们需要做的就是用谱图来归类。
对未知结构的解析,第一类方法是基于谱图相似性来在谱库中搜寻相似结构,从而达到归类的目的。对于EI质谱图,假设谱图的相似性可以代表结构相似性,NIST MS Interpreter软件基于k-最邻近方法(k nearest-neighbor approach)来生成子结构的信息[9]。此方法首先在NIST/EPA/NIH的谱库中寻找和未知物谱图相似的化合物,然后从相似化合物结构中推出未知物的结构特征。这种算法的优点是将每个检索到的化合物的相似度显著性进行了加权,并且通过识别“共有峰”来减少了搜索的次数。而后Demuth等改进了上述方法,提出相似度阈值的概念,高于阈值才可以认为谱图相似性可以代表结构相似性,提高了搜寻准确度[10]。对于串联质谱的数据处理,Sheldon等则提出使用前体离子指纹(precursor ion fingerprints, PIF)以及谱图树(spectral tree)来寻找相似化合物的方法[11]。
