人工智能可以通過分析人聲語音,相當准確地診斷出2型糖尿病。語音分析工具雖然提供了很多新的診斷可能性,但也存在很高的風險。
通過分析語音進行的醫學診斷技術正在變得越來越精確。尤其在帕金森綜合征或是阿爾茨海默症的診斷方面,對於患者說話聲音樣本的分析可以提供很有價值的依據。包括精神障礙、抑郁症、創傷後應激障礙或心髒病也可以通過語音分析來診斷。 人工智能 (AI) 還可以聽出血管狹窄或疲憊的跡象。 這使得醫生能夠更早地進行治療並降低患者的風險。根據專業雜志 Mayo Clinic Proceedings: Digital Health 發表的一項研究,現在憑借簡短的語音序列就能以驚人的准確性判斷某人是否患有 2 型糖尿病。
未知的風險
該技術旨在幫助找出未得到確診的糖尿病患者。全球約有 2.4 億成年人患有糖尿病而不自知。 根據國際糖尿病聯合會的數據,近 90% 的糖尿病病例都是 2 型糖尿病。 2 型糖尿病患者罹患心髒並和血管疾病的風險增加,例如心肌梗死、中風以及腿部和足部血液循環問題。使用語音分析進行診斷將使檢測變得更加容易,因為通常情況下人們必須去看醫生,才能進行最常見的診斷測試,其中包括空腹血糖測試(FBG)、口服糖耐量測試(OGTT)和糖化血紅蛋白值測試(A1C),該測試是為了測量兩到三個月內血糖水平的平均值。
語音診斷是如何運行的?
在語音頻率分析過程中,人工智能會分析人耳聽不見的人聲變化。只要有電話交談錄音,就足以進行分析。人工智能可以對說話的韻律、節奏、停頓和音高等元素進行分析。在某些臨床案例中,患者存在特有的語音特征,例如元音 A 的發音會持續五秒時間。人聲可以有多達 20萬種不同的特征。 人工智能和相應的算法可以從說話聲音片段中找到與某些臨床案例相匹配的獨特發音模式。
診斷精確度令人震驚
新開發的人工智能工具可以從6到10秒的語音錄音中識別到音調以及音量的變化,從而做出診斷。再結合年齡、性別、身高、體重等基本健康數據,AI就可以檢測出這個人是否患有2型糖尿病。而且它的准確度令人驚訝:由於男性和女性聲音的變化不同,因此准確度也有所不同。 盡管如此,該技術對女性的診斷准確率高達 89%,男性准確率則為 86%。
可以區分的聲學特征
為了對人工智能進行編程,安大略理工大學學者 Jaycee Kaufman 帶領的研究團隊記錄了 267 人的聲音,他們當中有的沒有糖尿病,有的已被診斷患有 2 型糖尿病。在兩周的時間裡,這些實驗對象每天要對著智能手機說六次話,每次只需短短一句話。從以這種方式獲得的 18000 多個語音樣本中,研究人員分析發現了在非糖尿病人和 2 型糖尿病人之間存在明顯差異的 14 個聲學特征。 該研究的主要作者、Klick Labs 研究員 Jaycee Kaufman 表示「當前的糖尿病檢測方法可能需要花費大量的時間、交通成本和就診費用。語音技術具有完全消除這些障礙的潛力。」
未來,Klick Labs 團隊希望繼續進行研究,看看高血壓和糖尿病前期等其他疾病是否也可以通過語音檢測來進行診斷。
語音頻率分析的風險
將語音分析作為診斷工具的支持者經常會強調使用語音診斷疾病的速度和效率。然而即使人工智能支持的工具已經提供了非常精確的信息,一些語音樣本也不足以真正做出有根據的診斷。假陽性結果和過度診斷的風險也仍然很高。最終還是需要由專業的醫生來親自進行確診。
提供線索而非醫學診斷
這一原則顯然也適用於精神類疾病。聲音的音調可能表明他患有抑郁症,但只有對這個人進行徹底檢查才能真正弄清楚。盡管人工智能可以使用語音分析來檢測比如一個人說話是否以比平時更加邏輯混亂或是更急促了,但這是否真的與注意力缺陷多動障礙(ADHD)有關,只能由醫療專業人員來做出診斷。
無法排除濫用風險
批評者和數據保護倡導者也一再指出,使用語音分析時存在巨大的濫用風險,例如雇主或健康保險呼叫中心的濫用。存在未經明確同意而使用語音分析系統的風險,並且客戶或員工可能會因個人健康信息而處於不利地位。同樣,敏感的醫療信息可能更容易被洩露、遭到黑客攻擊、被出售或以其他方式濫用。說到底,能夠為語音分析作為診斷工具制定明確規定和限制的並不是科學界,而是政界。
© 2023年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。
作者: Alexander Freund
本文由《德國之聲》授權提供
◤日本旅遊必買清單◢