pdfのデータからepubを作成することを調べていて、pythonのライブラリで比較的簡単にpdfからテキストは抽出できる とアドバイスをもらったので実際にやってみようと思います。 PyPDF2 pdfminer.six […]…
深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
Transcript 深層学習時代の⽂字認識とその周辺 技術本部 DSOC R&D Automation Group 研究員 宮本 優⼀ 【SenseTimeJapan × Sansan】画像処理勉強会 Data Strategy and Operation Center 自己紹介 2010年〜2015年 デジタルカメラメーカー • 画像処理系研究開発 2015年〜2020年 広告制作会社 • イベントなどで使われる画像…
Ocrolus lands $80M at a $500M+ valuation to automate document processing for fintechs and banks
If you’ve ever had to take out a loan, you know just how many documents are involved in the approval process. It’s a lot. The process is tedious and time-consuming, and in many more cases than you’d expect — still manual. Ocrolus is a startup that is hoping to change that with an automation platform […]