Mistral OCR 3: āļāđ‰āļēāļ§āļāļĢāļ°āđ‚āļ”āļ”āļ„āļĢāļąāđ‰āļ‡āđƒāļŦāļāđˆāļ‚āļ­āļ‡āļāļēāļĢāļ­āđˆāļēāļ™āđ€āļ­āļāļŠāļēāļĢāļ”āđ‰āļ§āļĒ AI

Mistral OCR 3 āļ„āļ·āļ­āđ€āļ§āļ­āļĢāđŒāļŠāļąāļ™āđƒāļŦāļĄāđˆāļĨāđˆāļēāļŠāļļāļ”āļ‚āļ­āļ‡āļĢāļ°āļšāļš OCR āļˆāļēāļ Mistral AI āļ—āļĩāđˆāļ–āļđāļāļ­āļ­āļāđāļšāļšāļĄāļēāđ€āļžāļ·āđˆāļ­āļĒāļāļĢāļ°āļ”āļąāļšāļ„āļ§āļēāļĄāđāļĄāđˆāļ™āļĒāļģāđāļĨāļ°āļ„āļ§āļēāļĄāļ—āļ™āļ—āļēāļ™āđƒāļ™āļāļēāļĢāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļ­āļāļŠāļēāļĢāļ—āļļāļāļ›āļĢāļ°āđ€āļ āļ— āļ•āļąāđ‰āļ‡āđāļ•āđˆāļŸāļ­āļĢāđŒāļĄāļĢāļēāļŠāļāļēāļĢ āļŠāđāļāļ™āļ„āļļāļ“āļ āļēāļžāļ•āđˆāļģ āđ„āļ›āļˆāļ™āļ–āļķāļ‡āļĨāļēāļĒāļĄāļ·āļ­āļ—āļĩāđˆāļ­āđˆāļēāļ™āļĒāļēāļ āļˆāļļāļ”āđ€āļ”āđˆāļ™āļŠāļģāļ„āļąāļāļ„āļ·āļ­āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļ—āļĩāđˆāđ€āļŦāļ™āļ·āļ­āļāļ§āđˆāļē Mistral OCR 2 āļ­āļĒāđˆāļēāļ‡āļŠāļąāļ”āđ€āļˆāļ™ āđ‚āļ”āļĒāļĄāļĩāļ­āļąāļ•āļĢāļēāļŠāļ™āļ°āļĢāļ§āļĄāļāļ§āđˆāļē 74% āđƒāļ™āļāļēāļĢāļ—āļ”āļŠāļ­āļšāļ āļēāļĒāđƒāļ™āļāļąāļšāđ€āļ­āļāļŠāļēāļĢāļˆāļĢāļīāļ‡āļˆāļēāļāļĨāļđāļāļ„āđ‰āļēāļ­āļ‡āļ„āđŒāļāļĢ

āļŠāļīāđˆāļ‡āļ—āļĩāđˆāļ—āļģāđƒāļŦāđ‰āļĢāļļāđˆāļ™āļ™āļĩāđ‰āđ‚āļ”āļ”āđ€āļ”āđˆāļ™āļ„āļ·āļ­āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢ “āđ€āļ‚āđ‰āļēāđƒāļˆāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āđ€āļ­āļāļŠāļēāļĢ” āđ„āļĄāđˆāđƒāļŠāđˆāđāļ„āđˆāļ”āļķāļ‡āļ‚āđ‰āļ­āļ„āļ§āļēāļĄāļ­āļ­āļāļĄāļēāđ€āļ—āđˆāļēāļ™āļąāđ‰āļ™ Mistral OCR 3 āļŠāļēāļĄāļēāļĢāļ–āļŠāļĢāđ‰āļēāļ‡ Markdown āļ—āļĩāđˆāļĄāļĩ HTML table reconstruction āđ€āļžāļ·āđˆāļ­āļĢāļąāļāļĐāļēāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ•āļēāļĢāļēāļ‡āļ—āļĩāđˆāļ‹āļąāļšāļ‹āđ‰āļ­āļ™ āđ€āļŠāđˆāļ™ merged cells, multi-row headers āđāļĨāļ° column hierarchy āļ‹āļķāđˆāļ‡āđ€āļ›āđ‡āļ™āļŠāļīāđˆāļ‡āļ—āļĩāđˆ OCR āļ—āļąāđˆāļ§āđ„āļ›āļ—āļģāđ„āļ”āđ‰āļĒāļēāļāļĄāļēāļ āļ™āļ­āļāļˆāļēāļāļ™āļĩāđ‰āļĒāļąāļ‡āļĢāļ­āļ‡āļĢāļąāļšāļāļēāļĢāļ”āļķāļ‡āļ āļēāļžāļ—āļĩāđˆāļāļąāļ‡āļ­āļĒāļđāđˆāđƒāļ™āđ€āļ­āļāļŠāļēāļĢāļ­āļ­āļāļĄāļēāļžāļĢāđ‰āļ­āļĄāļāļąāļ™ āļ—āļģāđƒāļŦāđ‰āđ€āļŦāļĄāļēāļ°āļŠāļģāļŦāļĢāļąāļš workflow āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļāļēāļĢāļ‚āđ‰āļ­āļĄāļđāļĨāļ„āļĢāļšāļ–āđ‰āļ§āļ™āđ€āļžāļ·āđˆāļ­āļ›āđ‰āļ­āļ™āđƒāļŦāđ‰ agent āļŦāļĢāļ·āļ­āļĢāļ°āļšāļš downstream āļ­āļ·āđˆāļ™āđ†

āļ­āļĩāļāļŦāļ™āļķāđˆāļ‡āļˆāļļāļ”āđāļ‚āđ‡āļ‡āļ„āļ·āļ­āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢāļˆāļąāļ”āļāļēāļĢāđ€āļ­āļāļŠāļēāļĢāļ—āļĩāđˆāļĄāļĩāļ„āļļāļ“āļ āļēāļžāļ•āđˆāļģ āđ€āļŠāđˆāļ™ āļŠāđāļāļ™āđ€āļ­āļĩāļĒāļ‡ āļ āļēāļžāđ€āļšāļĨāļ­ DPI āļ•āđˆāļģ āļŦāļĢāļ·āļ­āļĄāļĩ noise āļ‹āļķāđˆāļ‡āđ€āļ›āđ‡āļ™āļ›āļąāļāļŦāļēāļ—āļĩāđˆāļ­āļ‡āļ„āđŒāļāļĢāļˆāļģāļ™āļ§āļ™āļĄāļēāļāļ•āđ‰āļ­āļ‡āđ€āļˆāļ­āđƒāļ™āļ‡āļēāļ™āļˆāļĢāļīāļ‡ āđ„āļĄāđˆāļ§āđˆāļēāļˆāļ°āđ€āļ›āđ‡āļ™āđ€āļ­āļāļŠāļēāļĢāđ€āļāđˆāļē āđ€āļ­āļāļŠāļēāļĢāļĢāļēāļŠāļāļēāļĢ āļŦāļĢāļ·āļ­āđ„āļŸāļĨāđŒāļ—āļĩāđˆāļ–āļđāļāļ–āđˆāļēāļĒāļˆāļēāļāļĄāļ·āļ­āļ–āļ·āļ­ Mistral OCR 3 āļ–āļđāļāļāļķāļāļĄāļēāđƒāļŦāđ‰ robust āļ•āđˆāļ­āļŠāļ–āļēāļ™āļāļēāļĢāļ“āđŒāđ€āļŦāļĨāđˆāļēāļ™āļĩāđ‰āđ‚āļ”āļĒāđ€āļ‰āļžāļēāļ° āļ—āļģāđƒāļŦāđ‰āļœāļĨāļĨāļąāļžāļ˜āđŒāļĄāļĩāļ„āļ§āļēāļĄāđ€āļŠāļ–āļĩāļĒāļĢāđāļĨāļ°āļžāļĢāđ‰āļ­āļĄāđƒāļŠāđ‰āļ‡āļēāļ™āļĄāļēāļāļ‚āļķāđ‰āļ™āđƒāļ™āļĢāļ°āļ”āļąāļš production

āļŠāļļāļ”āļ—āđ‰āļēāļĒ Mistral OCR 3 āļĒāļąāļ‡āļĄāļēāļžāļĢāđ‰āļ­āļĄāļĢāļēāļ„āļēāļ—āļĩāđˆāđāļ‚āđˆāļ‡āļ‚āļąāļ™āđ„āļ”āđ‰āļĄāļēāāđ€āļžāļĩāļĒāļ‡ $2 āļ•āđˆāļ­ 1,000 āļŦāļ™āđ‰āļē āđāļĨāļ°āļĨāļ”āđ€āļŦāļĨāļ·āļ­ $1 āļ•āđˆāļ­ 1,000 āļŦāļ™āđ‰āļē āđ€āļĄāļ·āđˆāļ­āđƒāļŠāđ‰ Batch API āļ‹āļķāđˆāļ‡āļ–āļđāļāļāļ§āđˆāļēāļĢāļ°āļšāļš OCR āđ€āļŠāļīāļ‡āļžāļēāļ“āļīāļŠāļĒāđŒāļŦāļĨāļēāļĒāđ€āļˆāđ‰āļēāļ­āļĒāđˆāļēāļ‡āļĄāļĩāļ™āļąāļĒāļŠāļģāļ„āļąāļ āļ—āļģāđƒāļŦāđ‰āđ€āļ›āđ‡āļ™āļ•āļąāļ§āđ€āļĨāļ·āļ­āļāļ—āļĩāđˆāļ™āđˆāļēāļŠāļ™āđƒāļˆāļŠāļģāļŦāļĢāļąāļšāļ­āļ‡āļ„āđŒāļāļĢāļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļāļēāļĢāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļ­āļāļŠāļēāļĢāļˆāļģāļ™āļ§āļ™āļĄāļēāļāđ‚āļ”āļĒāđ„āļĄāđˆāļ•āđ‰āļ­āļ‡āļĨāļ‡āļ—āļļāļ™āļŠāļđāļ‡

āđ„āļŪāđ„āļĨāļ•āđŒāļ‚āļ­āļ‡ Mistral OCR 3
āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļ‚āļķāđ‰āļ™āļ­āļĒāđˆāļēāļ‡āļĄāļēāļ: āļŠāļ™āļ° Mistral OCR 2 āļ–āļķāļ‡ 74% āđƒāļ™āļāļēāļĢāļ—āļ”āļŠāļ­āļšāļ āļēāļĒāđƒāļ™
āļĢāļ­āļ‡āļĢāļąāļšāđ€āļ­āļāļŠāļēāļĢāļŦāļĨāļēāļāļŦāļĨāļēāļĒāļ›āļĢāļ°āđ€āļ āļ— āļĢāļ§āļĄāļ–āļķāļ‡āļĨāļēāļĒāļĄāļ·āļ­ āļŸāļ­āļĢāđŒāļĄ āđāļĨāļ°āļŠāđāļāļ™āļ„āļļāļ“āļ āļēāļžāļ•āđˆāļģ
āļŠāļĢāđ‰āļēāļ‡ Markdown āļžāļĢāđ‰āļ­āļĄ HTML table reconstruction āđ€āļžāļ·āđˆāļ­āļĢāļąāļāļĐāļēāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āđ€āļ­āļāļŠāļēāļĢ

āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđ€āļŠāļīāļ‡āđ€āļ—āļ„āļ™āļīāļ„
Robust āļ•āđˆāļ­ noise, skew, compression artifacts āđāļĨāļ° low DPI
āļ”āļķāļ‡āļ‚āđ‰āļ­āļ„āļ§āļēāļĄ + āļ āļēāļžāļāļąāļ‡āđƒāļ™āđ€āļ­āļāļŠāļēāļĢāđ„āļ”āđ‰āļžāļĢāđ‰āļ­āļĄāļāļąāļ™
āļĢāļ­āļ‡āļĢāļąāļš complex tables āļžāļĢāđ‰āļ­āļĄ colspan/rowspan

āļāļēāļĢāđƒāļŠāđ‰āļ‡āļēāļ™āļˆāļĢāļīāļ‡āđƒāļ™āļ­āļ‡āļ„āđŒāļāļĢ
āđ€āļŦāļĄāļēāļ°āļŠāļģāļŦāļĢāļąāļš pipeline āļ›āļĢāļīāļĄāļēāļ“āļŠāļđāļ‡ āđ€āļŠāđˆāļ™ āđƒāļšāđāļˆāđ‰āļ‡āļŦāļ™āļĩāđ‰ āđ€āļ­āļāļŠāļēāļĢāļ›āļāļīāļšāļąāļ•āļīāļāļēāļĢ āļĢāļēāļĒāļ‡āļēāļ™āļ§āļīāļŠāļēāļāļēāļĢ
āđƒāļŠāđ‰āđƒāļ™ Document AI Playground āđ€āļžāļ·āđˆāļ­āđāļ›āļĨāļ‡ PDF/āļ āļēāļžāđ€āļ›āđ‡āļ™ text āļŦāļĢāļ·āļ­ JSON āđ„āļ”āđ‰āļ—āļąāļ™āļ—āļĩ
āļĨāļđāļāļ„āđ‰āļēāđƒāļŠāđ‰āđ€āļžāļ·āđˆāļ­ digitize archives, extract structured fields āđāļĨāļ°āļ›āļĢāļąāļšāļ›āļĢāļļāļ‡ enterprise search

āļ”āđ‰āļēāļ™āļĢāļēāļ„āļēāđāļĨāļ°āļāļēāļĢāđ€āļ‚āđ‰āļēāļ–āļķāļ‡
āļĢāļēāļ„āļēāđ€āļžāļĩāļĒāļ‡ $2 āļ•āđˆāļ­ 1,000 āļŦāļ™āđ‰āļē (āļĨāļ”āđ€āļŦāļĨāļ·āļ­ $1 āđ€āļĄāļ·āđˆāļ­āđƒāļŠāđ‰ Batch API)
backward compatible āļāļąāļš Mistral OCR 2
āđƒāļŠāđ‰āļ‡āļēāļ™āļœāđˆāļēāļ™ API āļŦāļĢāļ·āļ­ Document AI Playground āđ„āļ”āđ‰āļ—āļąāļ™āļ—āļĩ

āļ›āļĢāļ°āđ€āļ”āđ‡āļ™āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļĢāļ°āļ§āļąāļ‡
āđāļĄāđ‰āļˆāļ° robust āđāļ•āđˆāđ€āļ­āļāļŠāļēāļĢāļ—āļĩāđˆāđ€āļŠāļĩāļĒāļŦāļēāļĒāļŦāļ™āļąāļāļ­āļēāļˆāļĒāļąāļ‡āļ•āđ‰āļ­āļ‡ preprocessing
āļāļēāļĢ reconstruct āļ•āļēāļĢāļēāļ‡āļ‹āļąāļšāļ‹āđ‰āļ­āļ™āļ­āļēāļˆāļ•āđ‰āļ­āļ‡āļ•āļĢāļ§āļˆāļŠāļ­āļšāļœāļĨāļĨāļąāļžāļ˜āđŒāļāđˆāļ­āļ™āđƒāļŠāđ‰āļ‡āļēāļ™ downstream
āļāļēāļĢāđƒāļŠāđ‰āļ‡āļēāļ™āđƒāļ™ pipeline āļ›āļĢāļīāļĄāļēāļ“āļĄāļēāļāļ•āđ‰āļ­āļ‡āļ§āļēāļ‡āđāļœāļ™āļ”āđ‰āļēāļ™ latency āđāļĨāļ° throughput

https://mistral.ai/news/mistral-ocr-3
🔍 Mistral OCR 3: āļāđ‰āļēāļ§āļāļĢāļ°āđ‚āļ”āļ”āļ„āļĢāļąāđ‰āļ‡āđƒāļŦāļāđˆāļ‚āļ­āļ‡āļāļēāļĢāļ­āđˆāļēāļ™āđ€āļ­āļāļŠāļēāļĢāļ”āđ‰āļ§āļĒ AI Mistral OCR 3 āļ„āļ·āļ­āđ€āļ§āļ­āļĢāđŒāļŠāļąāļ™āđƒāļŦāļĄāđˆāļĨāđˆāļēāļŠāļļāļ”āļ‚āļ­āļ‡āļĢāļ°āļšāļš OCR āļˆāļēāļ Mistral AI āļ—āļĩāđˆāļ–āļđāļāļ­āļ­āļāđāļšāļšāļĄāļēāđ€āļžāļ·āđˆāļ­āļĒāļāļĢāļ°āļ”āļąāļšāļ„āļ§āļēāļĄāđāļĄāđˆāļ™āļĒāļģāđāļĨāļ°āļ„āļ§āļēāļĄāļ—āļ™āļ—āļēāļ™āđƒāļ™āļāļēāļĢāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļ­āļāļŠāļēāļĢāļ—āļļāļāļ›āļĢāļ°āđ€āļ āļ— āļ•āļąāđ‰āļ‡āđāļ•āđˆāļŸāļ­āļĢāđŒāļĄāļĢāļēāļŠāļāļēāļĢ āļŠāđāļāļ™āļ„āļļāļ“āļ āļēāļžāļ•āđˆāļģ āđ„āļ›āļˆāļ™āļ–āļķāļ‡āļĨāļēāļĒāļĄāļ·āļ­āļ—āļĩāđˆāļ­āđˆāļēāļ™āļĒāļēāļ āļˆāļļāļ”āđ€āļ”āđˆāļ™āļŠāļģāļ„āļąāļāļ„āļ·āļ­āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļ—āļĩāđˆāđ€āļŦāļ™āļ·āļ­āļāļ§āđˆāļē Mistral OCR 2 āļ­āļĒāđˆāļēāļ‡āļŠāļąāļ”āđ€āļˆāļ™ āđ‚āļ”āļĒāļĄāļĩāļ­āļąāļ•āļĢāļēāļŠāļ™āļ°āļĢāļ§āļĄāļāļ§āđˆāļē 74% āđƒāļ™āļāļēāļĢāļ—āļ”āļŠāļ­āļšāļ āļēāļĒāđƒāļ™āļāļąāļšāđ€āļ­āļāļŠāļēāļĢāļˆāļĢāļīāļ‡āļˆāļēāļāļĨāļđāļāļ„āđ‰āļēāļ­āļ‡āļ„āđŒāļāļĢ āļŠāļīāđˆāļ‡āļ—āļĩāđˆāļ—āļģāđƒāļŦāđ‰āļĢāļļāđˆāļ™āļ™āļĩāđ‰āđ‚āļ”āļ”āđ€āļ”āđˆāļ™āļ„āļ·āļ­āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢ “āđ€āļ‚āđ‰āļēāđƒāļˆāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āđ€āļ­āļāļŠāļēāļĢ” āđ„āļĄāđˆāđƒāļŠāđˆāđāļ„āđˆāļ”āļķāļ‡āļ‚āđ‰āļ­āļ„āļ§āļēāļĄāļ­āļ­āļāļĄāļēāđ€āļ—āđˆāļēāļ™āļąāđ‰āļ™ Mistral OCR 3 āļŠāļēāļĄāļēāļĢāļ–āļŠāļĢāđ‰āļēāļ‡ Markdown āļ—āļĩāđˆāļĄāļĩ HTML table reconstruction āđ€āļžāļ·āđˆāļ­āļĢāļąāļāļĐāļēāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ•āļēāļĢāļēāļ‡āļ—āļĩāđˆāļ‹āļąāļšāļ‹āđ‰āļ­āļ™ āđ€āļŠāđˆāļ™ merged cells, multi-row headers āđāļĨāļ° column hierarchy āļ‹āļķāđˆāļ‡āđ€āļ›āđ‡āļ™āļŠāļīāđˆāļ‡āļ—āļĩāđˆ OCR āļ—āļąāđˆāļ§āđ„āļ›āļ—āļģāđ„āļ”āđ‰āļĒāļēāļāļĄāļēāļ āļ™āļ­āļāļˆāļēāļāļ™āļĩāđ‰āļĒāļąāļ‡āļĢāļ­āļ‡āļĢāļąāļšāļāļēāļĢāļ”āļķāļ‡āļ āļēāļžāļ—āļĩāđˆāļāļąāļ‡āļ­āļĒāļđāđˆāđƒāļ™āđ€āļ­āļāļŠāļēāļĢāļ­āļ­āļāļĄāļēāļžāļĢāđ‰āļ­āļĄāļāļąāļ™ āļ—āļģāđƒāļŦāđ‰āđ€āļŦāļĄāļēāļ°āļŠāļģāļŦāļĢāļąāļš workflow āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļāļēāļĢāļ‚āđ‰āļ­āļĄāļđāļĨāļ„āļĢāļšāļ–āđ‰āļ§āļ™āđ€āļžāļ·āđˆāļ­āļ›āđ‰āļ­āļ™āđƒāļŦāđ‰ agent āļŦāļĢāļ·āļ­āļĢāļ°āļšāļš downstream āļ­āļ·āđˆāļ™āđ† āļ­āļĩāļāļŦāļ™āļķāđˆāļ‡āļˆāļļāļ”āđāļ‚āđ‡āļ‡āļ„āļ·āļ­āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢāļˆāļąāļ”āļāļēāļĢāđ€āļ­āļāļŠāļēāļĢāļ—āļĩāđˆāļĄāļĩāļ„āļļāļ“āļ āļēāļžāļ•āđˆāļģ āđ€āļŠāđˆāļ™ āļŠāđāļāļ™āđ€āļ­āļĩāļĒāļ‡ āļ āļēāļžāđ€āļšāļĨāļ­ DPI āļ•āđˆāļģ āļŦāļĢāļ·āļ­āļĄāļĩ noise āļ‹āļķāđˆāļ‡āđ€āļ›āđ‡āļ™āļ›āļąāļāļŦāļēāļ—āļĩāđˆāļ­āļ‡āļ„āđŒāļāļĢāļˆāļģāļ™āļ§āļ™āļĄāļēāļāļ•āđ‰āļ­āļ‡āđ€āļˆāļ­āđƒāļ™āļ‡āļēāļ™āļˆāļĢāļīāļ‡ āđ„āļĄāđˆāļ§āđˆāļēāļˆāļ°āđ€āļ›āđ‡āļ™āđ€āļ­āļāļŠāļēāļĢāđ€āļāđˆāļē āđ€āļ­āļāļŠāļēāļĢāļĢāļēāļŠāļāļēāļĢ āļŦāļĢāļ·āļ­āđ„āļŸāļĨāđŒāļ—āļĩāđˆāļ–āļđāļāļ–āđˆāļēāļĒāļˆāļēāļāļĄāļ·āļ­āļ–āļ·āļ­ Mistral OCR 3 āļ–āļđāļāļāļķāļāļĄāļēāđƒāļŦāđ‰ robust āļ•āđˆāļ­āļŠāļ–āļēāļ™āļāļēāļĢāļ“āđŒāđ€āļŦāļĨāđˆāļēāļ™āļĩāđ‰āđ‚āļ”āļĒāđ€āļ‰āļžāļēāļ° āļ—āļģāđƒāļŦāđ‰āļœāļĨāļĨāļąāļžāļ˜āđŒāļĄāļĩāļ„āļ§āļēāļĄāđ€āļŠāļ–āļĩāļĒāļĢāđāļĨāļ°āļžāļĢāđ‰āļ­āļĄāđƒāļŠāđ‰āļ‡āļēāļ™āļĄāļēāļāļ‚āļķāđ‰āļ™āđƒāļ™āļĢāļ°āļ”āļąāļš production āļŠāļļāļ”āļ—āđ‰āļēāļĒ Mistral OCR 3 āļĒāļąāļ‡āļĄāļēāļžāļĢāđ‰āļ­āļĄāļĢāļēāļ„āļēāļ—āļĩāđˆāđāļ‚āđˆāļ‡āļ‚āļąāļ™āđ„āļ”āđ‰āļĄāļēāāđ€āļžāļĩāļĒāļ‡ $2 āļ•āđˆāļ­ 1,000 āļŦāļ™āđ‰āļē āđāļĨāļ°āļĨāļ”āđ€āļŦāļĨāļ·āļ­ $1 āļ•āđˆāļ­ 1,000 āļŦāļ™āđ‰āļē āđ€āļĄāļ·āđˆāļ­āđƒāļŠāđ‰ Batch API āļ‹āļķāđˆāļ‡āļ–āļđāļāļāļ§āđˆāļēāļĢāļ°āļšāļš OCR āđ€āļŠāļīāļ‡āļžāļēāļ“āļīāļŠāļĒāđŒāļŦāļĨāļēāļĒāđ€āļˆāđ‰āļēāļ­āļĒāđˆāļēāļ‡āļĄāļĩāļ™āļąāļĒāļŠāļģāļ„āļąāļ āļ—āļģāđƒāļŦāđ‰āđ€āļ›āđ‡āļ™āļ•āļąāļ§āđ€āļĨāļ·āļ­āļāļ—āļĩāđˆāļ™āđˆāļēāļŠāļ™āđƒāļˆāļŠāļģāļŦāļĢāļąāļšāļ­āļ‡āļ„āđŒāļāļĢāļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļāļēāļĢāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļ­āļāļŠāļēāļĢāļˆāļģāļ™āļ§āļ™āļĄāļēāļāđ‚āļ”āļĒāđ„āļĄāđˆāļ•āđ‰āļ­āļ‡āļĨāļ‡āļ—āļļāļ™āļŠāļđāļ‡ âœ… āđ„āļŪāđ„āļĨāļ•āđŒāļ‚āļ­āļ‡ Mistral OCR 3 ➡ïļ āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļ‚āļķāđ‰āļ™āļ­āļĒāđˆāļēāļ‡āļĄāļēāļ: āļŠāļ™āļ° Mistral OCR 2 āļ–āļķāļ‡ 74% āđƒāļ™āļāļēāļĢāļ—āļ”āļŠāļ­āļšāļ āļēāļĒāđƒāļ™ âžĄïļ āļĢāļ­āļ‡āļĢāļąāļšāđ€āļ­āļāļŠāļēāļĢāļŦāļĨāļēāļāļŦāļĨāļēāļĒāļ›āļĢāļ°āđ€āļ āļ— āļĢāļ§āļĄāļ–āļķāļ‡āļĨāļēāļĒāļĄāļ·āļ­ āļŸāļ­āļĢāđŒāļĄ āđāļĨāļ°āļŠāđāļāļ™āļ„āļļāļ“āļ āļēāļžāļ•āđˆāļģ ➡ïļ āļŠāļĢāđ‰āļēāļ‡ Markdown āļžāļĢāđ‰āļ­āļĄ HTML table reconstruction āđ€āļžāļ·āđˆāļ­āļĢāļąāļāļĐāļēāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āđ€āļ­āļāļŠāļēāļĢ âœ… āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđ€āļŠāļīāļ‡āđ€āļ—āļ„āļ™āļīāļ„ âžĄïļ Robust āļ•āđˆāļ­ noise, skew, compression artifacts āđāļĨāļ° low DPI ➡ïļ āļ”āļķāļ‡āļ‚āđ‰āļ­āļ„āļ§āļēāļĄ + āļ āļēāļžāļāļąāļ‡āđƒāļ™āđ€āļ­āļāļŠāļēāļĢāđ„āļ”āđ‰āļžāļĢāđ‰āļ­āļĄāļāļąāļ™ âžĄïļ āļĢāļ­āļ‡āļĢāļąāļš complex tables āļžāļĢāđ‰āļ­āļĄ colspan/rowspan ✅ āļāļēāļĢāđƒāļŠāđ‰āļ‡āļēāļ™āļˆāļĢāļīāļ‡āđƒāļ™āļ­āļ‡āļ„āđŒāļāļĢ âžĄïļ āđ€āļŦāļĄāļēāļ°āļŠāļģāļŦāļĢāļąāļš pipeline āļ›āļĢāļīāļĄāļēāļ“āļŠāļđāļ‡ āđ€āļŠāđˆāļ™ āđƒāļšāđāļˆāđ‰āļ‡āļŦāļ™āļĩāđ‰ āđ€āļ­āļāļŠāļēāļĢāļ›āļāļīāļšāļąāļ•āļīāļāļēāļĢ āļĢāļēāļĒāļ‡āļēāļ™āļ§āļīāļŠāļēāļāļēāļĢ âžĄïļ āđƒāļŠāđ‰āđƒāļ™ Document AI Playground āđ€āļžāļ·āđˆāļ­āđāļ›āļĨāļ‡ PDF/āļ āļēāļžāđ€āļ›āđ‡āļ™ text āļŦāļĢāļ·āļ­ JSON āđ„āļ”āđ‰āļ—āļąāļ™āļ—āļĩ ➡ïļ āļĨāļđāļāļ„āđ‰āļēāđƒāļŠāđ‰āđ€āļžāļ·āđˆāļ­ digitize archives, extract structured fields āđāļĨāļ°āļ›āļĢāļąāļšāļ›āļĢāļļāļ‡ enterprise search ✅ āļ”āđ‰āļēāļ™āļĢāļēāļ„āļēāđāļĨāļ°āļāļēāļĢāđ€āļ‚āđ‰āļēāļ–āļķāļ‡ âžĄïļ āļĢāļēāļ„āļēāđ€āļžāļĩāļĒāļ‡ $2 āļ•āđˆāļ­ 1,000 āļŦāļ™āđ‰āļē (āļĨāļ”āđ€āļŦāļĨāļ·āļ­ $1 āđ€āļĄāļ·āđˆāļ­āđƒāļŠāđ‰ Batch API) ➡ïļ backward compatible āļāļąāļš Mistral OCR 2 ➡ïļ āđƒāļŠāđ‰āļ‡āļēāļ™āļœāđˆāļēāļ™ API āļŦāļĢāļ·āļ­ Document AI Playground āđ„āļ”āđ‰āļ—āļąāļ™āļ—āļĩ ‾ïļ āļ›āļĢāļ°āđ€āļ”āđ‡āļ™āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļĢāļ°āļ§āļąāļ‡ â›” āđāļĄāđ‰āļˆāļ° robust āđāļ•āđˆāđ€āļ­āļāļŠāļēāļĢāļ—āļĩāđˆāđ€āļŠāļĩāļĒāļŦāļēāļĒāļŦāļ™āļąāļāļ­āļēāļˆāļĒāļąāļ‡āļ•āđ‰āļ­āļ‡ preprocessing ⛔ āļāļēāļĢ reconstruct āļ•āļēāļĢāļēāļ‡āļ‹āļąāļšāļ‹āđ‰āļ­āļ™āļ­āļēāļˆāļ•āđ‰āļ­āļ‡āļ•āļĢāļ§āļˆāļŠāļ­āļšāļœāļĨāļĨāļąāļžāļ˜āđŒāļāđˆāļ­āļ™āđƒāļŠāđ‰āļ‡āļēāļ™ downstream ⛔ āļāļēāļĢāđƒāļŠāđ‰āļ‡āļēāļ™āđƒāļ™ pipeline āļ›āļĢāļīāļĄāļēāļ“āļĄāļēāļāļ•āđ‰āļ­āļ‡āļ§āļēāļ‡āđāļœāļ™āļ”āđ‰āļēāļ™ latency āđāļĨāļ° throughput https://mistral.ai/news/mistral-ocr-3
MISTRAL.AI
Introducing Mistral OCR 3 | Mistral AI
Achieving a new frontier for both accuracy and efficiency in document processing.
0 āļ„āļ§āļēāļĄāļ„āļīāļ”āđ€āļŦāđ‡āļ™ 0 āļāļēāļĢāđāļšāđˆāļ‡āļ›āļąāļ™ 26 āļĄāļļāļĄāļĄāļ­āļ‡ 0 āļĢāļĩāļ§āļīāļ§