近日,Google Research推出了一項創新的人工智能技術——InkSight,該技術能夠直接從手寫文字圖片中提取數字文本,無需借助任何中間設備。這一技術突破,為手寫文字識別領域帶來了新的變革。

與傳統依賴光學字符識別(OCR)的手寫文字識別技術不同,InkSight在處理復雜背景、模糊或低光照條件下的手寫文字時,表現更為優異。它采用了一種模仿人類學習閱讀過程的方法,通過不斷重寫文本,學習單詞的外觀和含義。
InkSight在復雜場景下的識別能力尤為突出,即使文本部分遮擋或背景干擾,也能準確識別手寫文字。研究人員發現,人類閱讀InkSight生成的文本描摹的準確率高達87%,其中三分之二的描摹結果與真實手寫幾乎無法區分。
InkSight技術對于喜歡手寫的人群具有巨大潛力。用戶只需將手寫筆記拍攝成照片,即可迅速將其轉換為可搜索的數字文本。此外,對于字跡潦草的內容,InkSight也能實現清晰、準確的打印文本轉換。
值得注意的是,谷歌并非唯一一家致力于手寫識別AI技術的公司。亞馬遜的Kindle Scribe電子閱讀器和數字筆記應用Goodnotes等也推出了類似功能,將手寫文字轉換為可編輯的數字文本。





京公網安備 11011402013531號