RPAの認識方法 「文字イメージ認識方式」とは?

その名前の通り、文字を認識する方法のこと?

RPAがデスクトップ上で業務の処理を行うためには、RPA自身がデスクトップ画面の内容を認識する必要がありますが、RPAが認識する方法の中には「文字イメージ認識方式」があります。

文字イメージ認識方式とは、具体的にどのような方法で認識するのでしょうか。その内容についてみていくことにしましょう。

文字イメージ認識方式とは?

文字イメージ認識方式とは、RPAが操作対象を認識する場合に、画面の文字を参照しながら認識する方法のことです。

文字イメージ認識方式は高度な認識方法と言われていますが、なぜそのような認識方法が利用されるのでしょうか。

その理由としては、RPAが操作対象を認識する場合、デスクトップ画面のHTMLやCSSの言語を解析して認識する「対象オブジェクト認識方式」が利用できない場面において利用される方式だからです。

RPAが操作対象を認識する場合、通常はRPAが利用するデスクトップが目の前にあるため、対象オブジェクト方式で十分に認識ができます。

しかし、場合によってはデスクトップを遠隔操作によって利用する場合があります。

デスクトップを遠隔操作することを「リモートデスクトップ」と呼んでいますが、リモートデスクトップの場合は目の前にデスクトップがないため、HTMLやCSSの言語を解析できない状態となってしまいます。

その問題を解決するために、文字イメージ認識方式を活用し、画面上の文字を認識することによってRPAが操作対象を認識するのです。

このことから、文字イメージ認識方式は、リモートデスクトップを利用している場合に有効な認識方法と言えます。

RPAが画面の文字を認識する「OCR技術」

それでは、文字イメージ認識方式においては、どのようにして文字を認識するのでしょうか。

文字を認識するためには、「光学文字認識」を意味する「OCR技術」が用いられます。コンピュータが文字を認識する場合は、文字の形を認識するのではなく、それぞれの文字に割り当てられている「文字コード」で認識します。

文字コードを利用する理由は、データサイズを抑えられるためです。

画像データをそのまま保存すると、データサイズは大きくなってしまいますが、文字コードは数字とアルファベットで構成されているため、データサイズは小さなものとなります。

そのほか、文字コードを利用すると、異なるデスクトップであっても文字を認識することが可能となります。このことも文字コードを利用する理由と言えるでしょう。

OCR技術を活用することにより、リモートデスクトップを利用している場合であってもRPAが操作対象を認識することが可能となったのです。

文字イメージ認識方式を利用する場合の注意点は?

文字イメージ認識方式は、リモートデスクトップを利用している場合に有効であることが分かりましたが、文字イメージ認識方式を利用する場合に注意したいことはあるのでしょうか。

注意したい点としては、OCRの文字認識率は必ずしも100%ではないという点です。現在のOCR技術では、文字認識率は100%に近い状況ですが、ごくまれに文字が認識できない場合もあるのです。

認識できない可能性がある文字としては、画数の多い難しい漢字や、ローマ数字や「まるいち」(数字の1が○で囲まれたもの)のような「特殊文字」などがあげられます。

OCR技術で判別できない文字が含まれている場合は、RPAの利用中にエラーが発生する可能性も十分にありますので、文字イメージ認識方式を利用する場合は、特殊な文字を利用しないことも一つの方法となります。

文字イメージ認識方式を利用することによって、遠隔操作をしているデスクトップであってもRPAの操作対象を認識することが可能となっています。文字イメージ認識方式を活用し、RPAを存分に活用していきたいですね。

(画像は写真ACより)