CR和DR图像的交互式图像增强外文翻译资料

 2023-01-16 11:16:56

CR和DR图像的交互式图像增强

摘要

放射部门不断面临其提高生产率的压力。在CR/DR工作流程链中与生产率相关的两个重要链接是由技术专家进行的后处理步骤和由放射科医生进行的初步诊断步骤,他们可能需要额外的图像增强去协助诊断。随着CR和DR图像矩阵尺寸和这些算法计算复杂度的不断增大,提供交互式的图像增强变得越来越难,尤其是对全分辨率图像。我们已经使用了一种新的可编程处理器作为CR或DR图像增强算法的主要计算引擎。我们已经将这些算法划分给了处理器,以最大程度地利用其架构。在一个12位26882688的图像上,我们已经使用单个处理器实现了465ms的执行时间,适用于锐化掩膜,窗口/水平,图像旋转和查找表操作,与当前系统的响应时间相比至少可以提高一个数量级。这种性能有助于通过预设参数值进行快速计算和/或使技术人员能够在射线照片上进行真正的交互式质量检查处理。这些算法的快速响应时间在实时放射学设置中特别有用,可以大大减少放射科医生在进行诊断之前执行图像增强的等待时间。我们相信,将这些处理器用于快速CR / DR图像计算,再加上图像和患者数据的无缝流动,将使放射科获得更高的生产率。

关键词:数字化射线摄影,计算机射放射摄影,实时放射成像,高性能计算,工作流程,图像增强,质量分析处理

一、绪论

尽管传统的投影放射成像是最古老的医学成像方法,但它约占所有放射学检查的70%。[1]在二十世纪九十年代,计算机放射摄影(Computed Radiography, CR)的使用开始普及。大多数CR系统使用装在暗盒内的可光激发磷光体成像板,必须将其带到单独的CR读取器上进行扫描并形成数字图像。[2]随着高分辨率平板检测技术的进步,直接数字化摄影(Direct Radiography, DR)系统最近已被商业引入。DR图像由平板探测器采集,然后立即数字化。与传统的胶片系统相比,DR和CR在图片存档和通信系统(PACS)环境中的主要优点是图像捕获、处理、储存和显示的分离,从而可以单独优化每一个步骤。[3]

随着报销率的降低和诊断影像供应商之间竞争的加剧,许多放射科面临着一个艰巨的挑战,即在维持或增加影响服务的数量和质量的同时,减少人员和运营成本。[4]因此,许多机构都在试图提高放射科的生产率。与无胶片和无纸科相比,使用胶片的科室工作效率很低。Siegel和Reiner[5]确认过,使用胶片式X成像进行排序、获取、报告和检查住院胸部X光片需要59个步骤和11名工作人员。他们重新设计了工作流程,将CR和PACS结合使用,该PACS与医院/放射学信息系统(HIS / RIS)集成在一起,以促进图像和患者病历的自动电子传输。他们能从原本胶片式的工作流程中节省50个步骤,整个过程秩序4名工作人员即可。我们在图一中说明了剩余的九个步骤,这适用于CR和DR。在步骤五中,技术人员执行增强(或后处理)算法,以准备用于即将进行的诊断和咨询过程的图像。在步骤七中,放射科医生可以应用其他图像增强功能以​​辅助主要诊断。这些步骤花费的时间越多,CR / DR成像工作流程中的吞吐量就越低。通过实施提供放射服务,即在检查之后几乎立马给出医生的诊断结果,可以进一步提高生产率。尽管实时放射治疗会增加对放射科医生的需求,但这样能更好的为病人服务,特别是在紧急情况下(如重症监护和急诊室),因为他能显著缩短诊断的时间。[6]

图1 经过重新设计的CR或DR工作流程的九个步骤,用于住院胸部X光片

通常在CR和DR图像上执行的图像增强和处理算法在计算上很昂贵。在CR/DR图像上运行所有这些算法一直是计算难题。例如,AGFA DR胸部系统处理一个26882688像素的图像大约需要30s,[7]而柯达DirectView DR5100处理一个25603072像素的图像最多需要38s的循环周期。[8]这些系统需要3到10秒的时间才能生成X射线曝光后的预处理图像。考虑到周期时间中包括的其它组件,可以保守估计这些系统的后处理算法需要花费10秒。

图像增强算法的多输入参数是可能的,这可能需要基于多种因素进行调整,例如X射线剂量、身体部位、患者体型、观察者偏好或特定的感兴趣病理。柯达的可视化增强处理(EVP),[9]富士的动态范围控制(DRC)[10]和AGFA的多尺度图像对比度放大(MUSICA)[11]是典型的CR/DR增强算法,每个算法都有几个可调的输入参数。这些算法解决了放射照片的诊断相关动态范围过大而无法以良好对比度显示的问题。EVP和DRC都有三个可选参数,而MUSICA有四个。这些参数控制图像增强中的不同方案,例如界限、对比度和边缘增强。由于这些参数组合的多种可能,许多机构在质量检查处理中使用了预设,这可以简化和标准化图像增强过程。

我们的目标是为技术人员和放射科医生提供一种能快速执行图像增强算法的计算解决方案。达到此目标将有助于快速计算预设值和/或允许对增强参数进行真正的交互式调整。这些算法的快速响应时间可以通过减少再进行诊断时执行图像增强的等待时间来减少放射环境下放射科医生的负担。对于CR和DR计算,我们使用了为图像和视频应用产品开发的新一代高性能处理器,即媒体处理器。[12]为了证明将媒体处理器用作CR/DR图像处理算法计算引擎的可行性,我们将具有代表性的后处理算法映射到了Hitachi/Equator Technologies的单个MAP处理器。[13]

二、方法 图像增强算法

我们的计算模块常见的增强算法,可以优化射线照片以显示输出。[3]我们已经实现了两种对比度增强算法:(1)窗位调节以重新缩放对比度;(2)自适应非锐化掩膜以增强中高频信号。作为附加的对比度增强方法,我们还包括通用查找表(LUT功能),将选定的LUT应用于图像。对于许多图像处理和增强应用程序来说,LUT是一种简单却有效的方法。虽然王和一只通常是一种预处理算法,但我们已将其作为后处理算法包括在内,以使技术人员可以交互式地查看有或没有网格的图像。此外,我们还包括了图像旋转和翻转功能。图二展现了这些算法应用于技术人员和放射科医生的情况。技术人员检查和编辑X射线照片的质量,以减少放射科医生必须花费更多的时间进行进一步的操作。然后放射科医生可以将更多的精力放在诊断上,仅进行最少的增强处理。

图2 针对技术人员和放射科医生的CR和DR算法

在投影摄像中,通常使用线性栅格来衰减散射的X射线光子,从而提高图像的对比度和信噪比。但是当使用固定栅格时,其铅条会导致图像上出现栅格线的周期性阴影。如Barski和Wang所述,我们确定网格线的存在和确切频率。[14]如果未检测到栅格(例如,在不使用栅格或者移动栅格的情况下进行检查),则跳过栅格抑制过程,并将图像传递到后续的增强步骤。否则,我们将根据确切的栅格频率创建高斯带通滤波器,进行栅格抑制。通过一维快速傅里叶变换(FFT),我们将图像的每一行转换到频域。我们使用带通滤波器对一维FFT的结果进行滤波,有效去除了栅格相关数据外的绝大部分图像信息。然后,栅格抑制算法对每一行进行一维快速傅里叶逆变换,从而生成仅包含栅格相关信息的图像。最后,从原始图像中减去栅格图像,就得到了栅格抑制图像。除了消除了在栅格频率及其附近包含的噪声之外,栅格抑制处理对图像噪声含量的影响很小。值得注意的是,栅格频率不能接近CR阅读器或DR检测器的采样频率。否则锯齿状的栅格频率可能会与重要的图像内容混合在一起,而栅格抑制会大大牺牲图像质量。[14]

我们使用了自适应模糊锐化掩膜,通过放大图像的中高频分量来增加图像对比度。我们首先使用矩形滤波器对输入图像进行卷积。使用矩形滤波器是有利的,因为通过使用大内核尺寸可以使截止频率极低。接下来,我们通过从原始图像中减去低通滤波后的图像来获得包含中频和高频分量的图像。然后,将得到的高通滤波图像按加权因子进行缩放,然后添加到原始图像中。使用全局模糊锐化掩膜时,加权因子将均匀地应用于整个图像,它的优点就是简单。然而不利之处就是,它放大了信噪比较低的低X射线密度区域中的噪声。另一方面,自适应模糊锐化掩膜的好处是可以根据局部图像特征自适应地控制每个像素的加权因子。这是有用的,因为可能存在感兴趣的解剖对象(例如,胸椎或颈椎的病变)而不能无差别地抑制低X射线密度区域。我们计算局部3times;3梯度幅度,以强调物体轮廓和高频隔离噪声。然后,为了将物体与噪声区分开,我们采用局部3times;3邻域的最大梯度幅度。与解剖对象相比,类似尖峰的噪声倾向于产生较大的梯度幅度值,而解剖对象的像素值变化更为缓慢。因此,如果最大梯度幅度值高于可调整的阈值,局部区域可能会噪声较高,我们会调整加权因子。除此以外,加权因子的值是根据局部梯度强度来线性、均衡地设置的。

三、媒体处理器架构

市售媒体处理器的例子包括日立/赤道技术的MAP、德州仪器的TMS320C64、TTI的TriMedia以及英特尔的奔腾4。[15]媒体处理器是为图像和视频软件设计的,其计算是重复地交叉大量数据。作为指令级并行性的媒体处理器具有多个独立的功能单元,每个功能单元都可以在每个时钟周期执行一次操作。媒体处理器使用数据级的并行性,通过它可以将32位或64位操作数(取决于媒体处理器体系结构)视为多个子字(例如8位,16位或32位)。通过对这些子字执行分区算术运算,可以实现2倍、4倍或8倍的加速。[16] 当然,为了获得最大的潜在性能,需要尽可能多地利用功能单元。

在这项研究中,我们使用了450MHz的MAP媒体处理器来计算CR/DR图像增强算法。我们的许多增强算法都基于关键图像处理算法,例如卷积和FFT。我们将展示如何一维实数FFT和矩形滤波映射到MAP,以作为如何快速执行这些算法中计算量最高的部分的示例。

四、算法映射

底数为2N点的FFT需要()的实数乘法和()的实数加法/减法。[17]因此,对2688行的图像执行4096点一维FFT所需要的运算量略少于6亿。MAP的complex_multiply指令可以在一个周期内发出两个16位复数乘法,总计八个乘法和四个加法/减法。对于FFT蝶形计算有用的其他指令包括partitioned_add / subtract,它们负责执行多个16位加法和减法以及64位加载和存储。有关FFT实现的详细信息,请参见其他地方。[18]数字X射线照片仅包含实数部分,因此我们可以使用实数FFT而不是复数FFT来进一步减少计算量。由于实际信号的傅立叶变换是对称的,因此可以使用N / 2点复数FFT和后处理步骤来计算真实FFT 。[19]此外,我们的实际FFT仅生成频谱的一半,这使频域计算量减少了一半。类似地,实数FFT是可逆的。

对于大图像进行大内核卷积的强力方法在计算上非常昂贵,对于每个输出点的MM内核大小,需要M2-1个加法运算。因此将26882688的图像与128128的内核进行卷积将需要大约2350亿次运算,这是不切实际的。利用二维矩形滤波器的可分离性,可将此数目减少为2(M-1)个。为了使滤波后的图像大小与输入图像大小相同,我们在开始执行矩形滤波之前,用边界图像像素填充输入图像。我们首先将M个像素的初始行像素平均值定义为:

其中,是填充的输入图像,M是奇数内核大小。我们通过以下方法使用初始移动平均值,计算下一个点:

创建新的移动平均值。通过采用先前的移动平均值并根据等式计算新的移动平均值,类似地计算所有后续中间输出值。因此,初始移动平均值之后的所有中间输出仅需一加一减。在逐行卷积之后,我们可以在中间图像的每一列上重复移动平均运算。有关Boxcar滤波算法的更多信息,请参见其他地方。[20]

五、结果和讨论

我们已经实现了两种计算上最昂贵的算法的快速响应时间,一维实数快速傅里叶变换和矩形滤波。我们的一维4096点基数2复数FFT对2688行图像的执行时间为371ms。相比之下,我们的一维实数FFT需要215ms。因此,通过执行一维实数FFT,执行时间减少了42%。如图三所示,矩形滤波的处理速度几乎与内核大小无关。

图3 作为Boxcar内核大小的函数,在26882688的12位图像上进行二维矩形滤波的性能

如图所示,将内核大小从77增加到201201只会导致处理时间增加6%(从140ms到148ms),这是可能的,因为在对行或列进行初始移动平均计算之后,每个输出只需要一个很少的算术运算。

表1 在450MHz-MAP处理器上的26882688 12位图像增强任务的执行时间

Tasks

Time(ms)

Parameter

Grid suppression

559

Adaptive unsharp

308

201201 boxcar

Ma

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[239028],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版