臨床検査試薬管理の憂鬱を解決する(3)

前回の続きになります。

最終ゴール

  • 試薬ラベル写真を撮影し入出庫や在庫を管理する。
  • システムが写真を分析し、できるだけ人は何もしなくても良い。
  • 試薬名と製造番号、有効期限を自動で確定できる。
  • 操作者の情報と実施日時を上記情報と併せてデータベースに記録する。
  • 運用は完全ペーパレスでできるようにする(例外は作らない)。
  • 撮影できない試薬があっても、できるだけユーザーの作業を少なくする(撮影の代替手段をつくる)。
  • 撮影場所を限定しない(どこででも撮影可能に。リーダー接続のPCがなくてもできる)。
  • 台帳(pdf出力)できるようにする。

とにもかくにも、この掲げた目標を実現するため試行錯誤する日々が続きました。

弊社は特に他の案件を受けているわけではありません。これが完成できなければ、・・そして売れなければすぐにでも倒産してしまうでしょう。

特徴量分析、シンプルなパターンマッチ・・・・色々試しました。

結果・・・・・全く駄目でした。全て駄目なわけではなく、あらゆるラベルや、その文字を安定して処理することができなかったのです。

始めた頃から実現する手法は、頭の中にはあれしかないとは考えていたのですが、おいそれと手をだせる環境ではなかったので、先送りにしてきました。

そう、あれとは

深層学習(ディープラーニング)です!。

深層学習とは、簡単に言えば「既知の問題を学習し、システムが自動で答える方法を見つけ出し、未知の問題を解決する」といったところでしょうか?なんだか、よくわからないような感じですが・・・、今回の目的で言えば、字を判別するために従来は、人が「あ」ならば「あ」であることの判別条件を見つけ出しシステムに設定してやる必要がありました。しかし深層学習であれば、「あ」の例を数千〜数万回システムに与えると、システムが自動で「あ」であることの条件を見つけ出すのです。その見つけたルールに従って、字を判別することができるようになります。

当時は、手書き文字の認識率ですごい高い値をたたきだしたとか、物体を識別できるとか、それはもう数ヶ月おきに新しい手法が発表されるような状況でした。AIで全て解決できる風潮が生まれた時期です。

当時の自分は、その風潮には違和感も感じていました。AIが全ての問題で、人のように柔軟に解決することはできないだろうと、できるとしても、だいぶ先のことになるのではと。ただ特定の分野においては、非常に有用だろう、ことこの文字認識については、ディープラーニングしかないとの確信がありました。

新技術というものは、

1.現実以上に期待され持ち上げられる。

2.できない事があることがわかって、興味が薄れる。

3.それでも進歩し続けて、導入が進む。

4.一般化する。

こういった過程をたどるような気がします。2と3の間に消えてしまうことも多いのですが、ディープラーニングの勢いは凄まじいものがありました。とにかく進歩のスピードが尋常なく、ぼやぼやしているうちに文書の手書き文字判別サービスも開始されるなど一般化されるスピードも桁違いでした。

いつか誰でも気軽に使っている技術になるのは間違いない。これに賭けてみよう。

そう決めたものの、進捗は遅々としており、気ばかり焦ります。ディープラーニング使用を妨げるの最大の障壁は教師となるデータでした。

まずその必要数が尋常ではありません。子供が飛行機を見て覚えれば、次からは飛行機を違う方向からみても飛行機と答えられるでしょう。でもディープラーニングでそれを実現するためには、あらゆる方向から飛行機を撮影せねばなりません。学習に使用する枚数は数千枚以上になります。弊社が試薬のラベルをその数集めることは現実的には不可能です。

さらに、なんとかして教師データが集まったとして、学習させるには高機能のコンピューターが必要となります。高機能なコンピューターを使用して、場合によっては数日間学習を続ける必要があります。

教師データも高機能のコンピューターもどちらも持っていません。とにかくできることから始めよう、そう思い少数の試薬ラベルデータを元にディープラーニングを試し始めたのは、2018年の夏のことでした。

To be continued………..

By