臨床検査試薬管理の憂鬱を解決する(4)

前回の続きになります。

ディープラーニングを使用して、ラベルを分析する。

2018年の規格外れな酷暑の中、このアイディアの存亡をかけたプロダクトがスタートしました。前回述べたように、大きな課題は二つありました。

・膨大な数の教師データが必要。

・高性能なコンピューターが必要。

この二点ですが、高性能なコンピューターはクラウドサービスで時間単位で借りることで解決できました。Amazonなどのクラウドサービスを使用することで、自分専用の環境をいつでも使用することができます。使用しない時には、休止しておけば料金はかかりません。

クラウドを利用することで、サーバーを院内に置く場合に比べて、費用を抑えることが可能です。実際のサービスも、この方法を採用することにしました。

次に教師データです。

これは以前、病院で働いた経験から、文字が表記されるパターンをいくつかは知っていました。これを元に、擬似的に試薬ラベル画像を作成するプログラムをまず作成することにしました。実際に撮影される場合には、明るさなど条件は一定ではないため、ノイズを加えたり、暗くしたりと様々な質の画像を作成しました。

フォントサイズ、フォントの種類、文字の色、背景の色・・・・等々、考えると条件はたくさんあり、画像は膨大な量になりました。これを1枚ずつ、システムに教えるための正解を設定する作業をします。

これが・・・延々と続きます。これが一番辛かったかも・・・。

最初のプロトタイプに、この画像を学習させます。

ディープラーニングで難しかったのは、この学習した結果をさらによくするためには、教師データに問題があるのか、パラメータのチューニングが必要なのかを判断するのかを見極めるところでした。長い時間かけて学習しないと、最終的な結果が判明しないため、条件を変えて何回も学習しないと方向性が決まりません。

それを繰り返し、繰り返し・・・・とうとう2018年が終わりました。

2019年2月。

学習したシステムを用いて、病院にご協力いただき、実際の試薬ラベルを解析してみました。

試薬名とロットなどを、正しく識別することができました。

ただし、まだ完璧ではなく改良の必要はありました。しかしこの方向性で、数年前から思い描いたシンプルな試薬管理が実現できると確信した時でした。もちろん全ての文字を読めるわけではありません。小さい文字などは人間と同じで読むことはできません。

技術が全てを解決できるわけではありません。

まだ足りない部分は人間のオペレーターが助ける必要があります。でもスマホを用いてバーコードでなく試薬ラベルで管理するサービスは、こうして誕生しました。

現在も、開発は継続しており20日間連続で学習中です。どんどんシステムはスマートになっていきます。しかし実際の試薬ラベルデータは、まだ少ないためサービスを開始しても学習は継続されます。

実績もない、夢しかないベンチャーです。色々とご不安もおありでしょうが、ご検討いただける病院さまがいらっしゃいましたら、ご安心ください。全力で事にあたらせていただきます。

我々もAIもどんどん経験を積み学習しています。

ぜひ我々にあなたのお手伝いをさせてください。

システムの名前は、「LABOVISION」。

もうすぐご紹介いたします。

By