ボーカルバイオマーカでCOVID-19と戦う



新型コロナウィルス(COVID-19)の勢いが止まりません。2020年11月に入り、東京の一日の新規感染者数は記録を更新し続けています。あれだけ騒がれていたPCR検査問題は、検査数は増えていると聞きますが、身近にPCR検査を行ったという人はほとんどいません。誰もが安心して感染の有無を確認できる検査方法が必要です。この発明は、音声ベースのボーカルバイオマーカによって、COVID-19スクリーニングを行う発明です(US20200323484、VOCALIS HEALTH)。


新型コロナウイルス(COVID-19)パンデミック



2020年3月11日、世界保健機関(WHO)は、新型コロナウイルス(COVID-19)がパンデミック(世界的大流行)であると宣言しました。COVID-19は、2019年12月下旬に中国の武漢で最初に報告されて以来、世界で216を超える国と地域に広がっています。2020年11月19日時点では、全世界で55,928,327件の検査確定症例と1,244,023件の死亡が報告されています(WHOホームページ)。2020年6月時点(確定症例は約7,000,000件、死亡約400,000件)と比べると、感染者数で約8倍、死亡数で約3倍となり、全世界的に感染拡大傾向が続いており、勢いが止まりません。


WHOホームページ

https://extranet.who.int/kobe_centre/ja/covid


COVID-19感染は、呼吸器疾患のクラスターを引き起こし、特に高齢者または基礎疾患を有する人々においては、集中治療室への入院および高い死亡率につながっています。一般的な症状には、発熱、咳、息切れ、筋肉痛または倦怠感などがありますが、症状は患者によって大きく異なり、感染した患者の大多数は無症状です。そのため、COVID-19に感染していたとしても、無症状のために感染しているかが分からず、無自覚のままに他人にウィルスを感染させてしまっているケースが生じています。これを防ぐためには、人と人との接触を最小限にするしかなく、三密を避けたり、人が集まる場所の人数制限をしたり、対策をとっています。しかし、人の移動を伴う経済活動が制限されることになり、生命の安全と経済の両立の厳しい舵取りが模索されています。


COVID-19を有する対象をスクリーニングするための方法


誰もが安心して感染の有無を確認できる検査方法が必要です。 現在実施されている、PCR検査(ポリメラーゼ連鎖反応に基づく方法)や、ディープシーケンシングなどの検査方法は、感染有無を検査するのに不可欠な役割を果たしますが、厳密な実験室仕様であり、検査結果はすぐには入手できません。また、検査を行う技能者の数が少ない、検査者への感染リスクを伴う、などの限界があります。さらに、これらの方法は、サンプル収集の場所での十分なウィルス量の存在に依存しており、偽陰性の可能性を生み出します。


体温スクリーニングは、建物への入場時点(医療現場、工場、空港、小売店)でのリスクをスクリーニングするために実施されます。しかし、中国とニューヨーク市でCOVID-19が確認された1,099人と5,700人の入院患者データをまとめた2つの研究では、入院時に発熱した患者は、それぞれ43.8%と30.7%に過ぎなかったと報告されています。体温スクリーニングだけでは、ウィルス感染している人を見逃す可能性があります。


音声ベースのボーカルバイオマーカ


音声は、健康をスクリーニングおよび監視するためのバイオマーカとして役立つことができる非侵襲的で受動的な信号です。音声分析は、パーキンソン病、閉塞性睡眠時無呼吸症、および自閉症スペクトラム障害を検出するために使用されてきました。音声バイオマーカは、音声録音の音響特性を分析して、ユーザーの健康状態に関する洞察を提供するために使用されます。


この発明は、COVID-19について未知の対象をスクリーニングするためのコンピュータベースの方法です。以下のステップを含みます(Fig.1、Fig.2)。

  1. スクリーニングされた対象から音声クリップを記録する。

  2. スクリーニングされた対象の音声クリップを前処理する。

  3. 前処理されたスクリーニングされた対象の音声クリップのスペクトログラムを計算する。

  4. スクリーニングされた対象スペクトログラムから特徴ベクトルを抽出する。

  5. 抽出されたスクリーニングされた対象特徴ベクトルにCOVID-19音声バイオマーカの機械学習分類器を適用し、それにより、COVID-19音声バイオマーカ値を受け取る。

  6. COVID-19音声バイオマーカ値に基づいて、スクリーニングされた対象がCOVID-19陽性またはCOVID-19陰性であることを出力する。


人工知能を用いてCOVID-19ボーカルバイオマーカを生成する


この発明の明細書には、人工知能を用いてボーカルバイオマーカを生成するステップが詳細に記載されています。詳しくご覧になりたい方は全文明細書をご参照ください。


データ収集


参加者は、スマートフォン、パーソナルコンピュータ、タブレットで症状質問票に記入しました。データは、各分析のためのトレーニングセットおよびテストセットに分割されました。各分析では、以下に説明するのと同じ音声特徴抽出およびモデル評価プロセスがトレーニングセットで実行され、検証手順がテストセットで実行されました。


音声特徴抽出


Fig.3は、転移学習および適応方法を使用して各分析で実施される特徴抽出プロセスを示しています。特徴抽出プロセスは、公開されている転移学習と適応方法に基づきます。録音は16kHzにダウンサンプリングされ、スペクトログラムは短時間フーリエ変換を使用して計算されました。各スペクトログラムは、事前にトレーニングされた深層畳み込みニューラルネットワークを通過しました。これにより、各記録に対して512次元の特徴ベクトルが生成されました。このアプローチにより、小さなトレーニングデータベースで最先端の結果が得られました。


バイオマーカのトレーニングとモデル評価プロセス


10分割交差検証手順が実施され、いくつかのモデルが、異なる正則化レベルで評価されました(k最近傍、サポートベクターマシンおよびランダムフォレスト)。各分析において、モデルの結果は、受信者動作曲線(AUC)の下の平均面積によって評価されました。各分析用に選択されたモデルは、上記の512の特徴の非線形結合である0-1の間の正のスカラーである音声バイオマーカとして記述されます。


このボーカルバイオマーカは、非接触なので安全・手軽で、毎日検査できるところがメリットです。最初の一次スクリーニングとして活用すれば、医療従事者の負担も大幅に軽減されると思われます。某接触確認アプリよりも簡単で使いやすそうです。



この発明は、今年の6月にアメリカに特許出願され、10月に公開特許が発行されました。出願人Vocalis Healthは、イスラエルのAIヘルステック企業です。音声を分析して特定の疾患の固有の音声バイオマーカを見出すことにより、個別化されたヘルスケアスクリーニング、トリアージ、および健康の継続的なリモートモニタリングのための独自の音声バイオマーカを作成する音声対応AIプラットフォームを開発しています。


https://vocalishealth.com/


このように、最新AI用途発明は、最先端テクノロジーを用いてスピーディに社会課題を解決する取り組みとしても参考になります。