今回は、AutoCAD Plant3D(以下Plant3D)やAutoCADからPDFで出力した図面の文字認識について考えてみたいと思います。
大昔に先輩から「AutoCADの文字フォントはビッグフォントだ!」と言われて以来、特に深く考えずにずっとその通りにやってきました。当時は、紙で印刷するのが主流でPDFファイルを作るという文化もこの業界にはありませんでした。それから20年以上の時が経ち、コロナもあってようやくPDFファイルが主流になりました。(世の中的な転機としては、2008年にISOにより正式に規格化された事で爆発的に普及したのだと思います。)
PDF出力したら困った(不便)なことが発生
主流が紙からPDFへ変化した事で、問題(不便さ)が発生しました。ずばり、Adobe AcrobatでPDFを開いても、文字認識してくれない。(注釈(コメント)としては認識しています)
それもそのはず。AutoCADには2タイプのフォントが存在します。TTFフォントとSHXフォントです。TTFフォントはPC本体が持っているフォントタイプです。SHXフォントはAutoCADオリジナルフォントになります。
SHXフォントの方が、AutoCADオリジナルの為、CAD上で何かと細かい設定ができて便利です。というかそのために作られたのでしょう。でも、そのせいでPDF出力した場合は文字としてではなく他の線や円と同様の認識になってしまいます。(何年か前に、注釈コメントとして認識するように変更されましたが、その場しのぎ感が否めません。)
そうだ!フォントを変えてみよう!
とあるお客さんのPDFファイルを開いたら文字認識がされているではありませんか!何が違うのだろうと色々と検証していたら、一つの結論が見えてきました。
TTFフォントの日本語対応(MSゴシックやMS Pゴシックなど)文字を使ってみよう!
あとは印刷設定でAutoCAD PDFを選択してPDF出力するだけで、OCR認識されるようになりました。めでたしめでたし。
さらにDXへ発展させるには
今回の話をさらにDX発展させるために、もう一工夫してみましょう。せっかく機械が文字を読み取れるようになったので、それを活かして業務改善をしました。
具体的には、何枚もあるP&IDの中から、配管番号や計器番号を検索してもらう事でした。
今までは、自分で一枚ずつ確認しながらどこにあるかと宝探しをしていたのですが、それを今はやりのAI(私の場合は、NotebookLM)にPDFファイルを読み込ませ、「〇〇配管番号はどのページあるか教えて!」と聞くだけで、ものの数秒で探してくれるようになりました。
ある調査によると、サラリーマンは就業時間の約10%を探し物(検索なども含む)の時間に充てているそうです。AIが得意なことは積極的にAIに任せて、自分の時間を本来必要なクリエイティブな時間に割り当てていきましょう。
まとめ
AutoCADで文字を入力する時は、文字スタイル管理設定でフォントをTTFフォント(おすすめはMSゴシック)にしよう!
そうすることでOCR認識されたPDF出力が可能になり、機械が文字認識できるようになります。

時代の流れによって、今までは人間が読みやすい図面を描けるかが重要だったものが、機械がちゃんと読めるように図面を描けるかに変化していったということだと思っています。
これからも日々、いつもの当たり前を疑いながら仕事をしていかなければならないと学びました。

昨日までの常識が、今日から非常識になるニャ!


コメント