Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este conteúdo aplica-se a:
v4.0 (GA) | Versões anteriores:
v3.1 (GA)
v3.0 (em retirada)
v2.1 (em retirada)
Este conteúdo aplica-se a:
v3.0 (em descontinuação) | Últimas versões:
v4.0 (GA)
v3.1 | Versão anterior:
v2.1 (em descontinuação)
Este conteúdo aplica-se a:
v2.1 | Última versão:
v4.0 (GA)
O Azure Document Intelligence nos modelos Foundry Tools oferece suporte para processamento de documentos multilíngue. As nossas capacidades de suporte linguístico permitem aos seus utilizadores comunicar com as suas aplicações de forma natural e potenciar o alcance global. Os modelos de análise documental permitem a extração de texto de formulários e documentos e devolvem conteúdos estruturados prontos para negócios, prontos para a ação, utilização ou progresso da sua organização. As tabelas seguintes listam o suporte de línguas e localidades disponíveis por modelo e funcionalidade:
- Ler: O modelo de leitura permite a extração e análise de texto impresso e manuscrito. Este modelo é o motor de OCR subjacente para outros modelos pré-construídos de Inteligência Documental, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para mais informações, consulteLer visão geral do modelo
- Layout: O modelo de layout permite a extração e análise de texto, tabelas, estrutura do documento e marcas de seleção (como botões de acesso e caixas de seleção) a partir de formulários e documentos.
- Documento geral: O modelo geral de documentos permite a extração e análise de texto, estrutura do documento e pares-chave-valor. Para mais informações, consulteVisão Geral do Modelo de Documentos
Nota
Código linguístico opcional
Os modelos universais baseados em deep learning da Document Intelligence extraem todo o texto multilíngue dos seus documentos, incluindo linhas de texto com línguas mistas, e não exigem especificar um código linguístico.
Não forneça o código da linguagem como parâmetro a menos que tenha a certeza da linguagem e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode devolver texto incompleto e incorreto.
Além disso, não é necessário especificar um local. Este é um parâmetro opcional. A tecnologia de deep learning Document Intelligence irá detetar automaticamente a linguagem do texto na sua imagem.
Modelo de leitura
ID do modelo: leitura pré-configurada
A tabela seguinte lista o suporte de linguagem do modelo de leitura para extrair e analisar texto impresso.
| Linguagem | Código (opcional) |
|---|---|
| Abaza | abq |
| Abkhazo | ab |
| Chinês | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Afar | aa |
| Africâner | af |
| Akan | ak |
| Albanês | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Árabe | ar |
| Asturiano | ast |
| Asu (Tanzânia) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Aymara | ay |
| Azeri (latim) | az |
| Bafia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Bashkir | ba |
| Basco | eu |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (latim) |
be, be-latn |
| Bemba (Zâmbia) | bem |
| Bena (Tanzânia) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bósnio (latim) | bs |
| Brajbha | bra |
| Bretão | br |
| Búlgaro | bg |
| Bundeli | bns |
| Buriate (cirílico) | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Checheno | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chinês Simplificado | zh-Hans |
| Chinês Tradicional | zh-Hant |
| Choctaw | cho |
| Chukot | ckt |
| Chuvash | cv |
| Cornish | kw |
| Corso | co |
| Cree | cr |
| Ribeira | mus |
| Tártaro da Crimeia (latim) | crh |
| Croata | hr |
| Corvo | cro |
| Checo | cs |
| Dinamarquês | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Holandês | nl |
| Efik | efi |
| Inglês | en |
| Erzya (cirílico) | myv |
| Estónio | et |
| Faroês | fo |
| Fijiano | fj |
| Filipino | fil |
| Finlandês | fi |
| Linguagem | Código (opcional) |
|---|---|
Fon |
fon |
| Francês | fr |
| Friulano | fur |
Ga |
gaa |
| Gagauz (latim) | gag |
| Galego | gl |
| Ganda | lg |
| Gayo | gay |
| Alemão | de |
| Gilbertês | gil |
| Gondi (Devanagari) | gon |
| Grego | el |
| Gronelandês | kl |
| Guarani | gn |
| Gurung (Devanagari) | gvr |
| Gusii | guz |
| Crioulo Haitiano | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Havaiano | haw |
| Hebraico | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (latim) | mww |
| Ho (Devanagiri) | hoc |
| Húngaro | hu |
| Iban | iba |
| Islandês | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonésio | id |
| Inguche | inh |
| Interlíngua | ia |
| Inuktitut (Latin) | iu |
| Irlandês | ga |
| Italiano | it |
| Japonês | ja |
| Jaunsari (Devanagari) | Jns |
| Javanês | jv |
| Jola-Fonyi | dyo |
| Kabardiano | kbd |
| Kabuverdianu | kea |
| Kachin (latim) | kac |
| Kalenjin | kln |
| Calmuque | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (Cirílico) | kaa-cyrl |
| Kara-Kalpak (Latim) | kaa |
| Caxubiano | csb |
| Cazaque (cirílico) | kk-cyrl |
| Cazaque (latim) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche' | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Coreano | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraean | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (cirílico) | kum |
| Curdo (árabe) | ku-arab |
| Curdo (latim) | ku-latn |
| Kurukh (Devanagari) | kru |
| Quirguiz (cirílico) | ky |
Lak |
lbe |
| Lakota | lkt |
| Linguagem | Código (opcional) |
|---|---|
| Latim | la |
| Letão | lv |
| Lezghiano | lex |
| Lingala | ln |
| Lituano | lt |
| Baixo Sorábio | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Quénia e Tanzânia) | luo |
| Luxemburguês | lb |
| Luyia | luy |
| Macedónio | mk |
| Machame | jmc |
| Madurês | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaxe | mg |
| Malaio (latim) | ms |
| Maltês | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maori | mi |
| Mapudungun | arn |
| Marathi | mr |
| Mari (Rússia) | chm |
| Masai | mas |
| Mende (Serra Leoa) | men |
| Meru | mer |
| Meta' | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongol (cirílico) | mn |
| Mongondow | mog |
| Montenegrino (cirílico) | cnr-cyrl |
| Montenegrino (Latim) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Nahuatl | nah |
| Navajo | nv |
| Ndonga | ng |
| Napolitano | nap |
| Nepali | ne |
| Ngomba | jgo |
| Niueano | niu |
| Nogay | nog |
| Ndebele do Norte | nd |
| Sami do Norte (latim) | sme |
| Norueguês | no |
| Nyanja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitano | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossética | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Pashto | ps |
| Pedi | nso |
| Persa | fa |
| Polaco | pl |
| Português | pt |
| Punjabi (árabe) | pa |
| Quéchua | qu |
| Ripuariano | ksh |
| Romeno | ro |
| Romanche | rm |
| Rundi | rn |
| Russo | ru |
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Sakha | sah |
| Samburu | saq |
| Samoa (latim) | sm |
| Sango | sg |
| Linguagem | Código (opcional) |
|---|---|
| Sangu (Gabão) | snq |
| Sânscrito (Devanagari) | sa |
| Santali (Devanagiri) | sat |
| Escoceses | sco |
| Gaélico Escocês | gd |
| Sena | seh |
| Sérvio (cirílico) | sr-cyrl |
| Sérvio (latim) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Eslovaco | sk |
| Esloveno | sl |
| Soga | xog |
| Somali (árabe) | so |
| Somali (latim) | so-latn |
| Songhai | son |
| Ndebele do Sul | nr |
| Altai do Sul | alt |
| Sami do Sul | sma |
| Sotho do Sul | st |
| Espanhol | es |
| Sundanês | su |
| Suaíli (latim) | sw |
| Swati | ss |
| Sueco | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Taitiano | ty |
| Taita | dav |
| Tajique (cirílico) | tg |
| Tamil | ta |
| Tártaro (Cirílico) | tt-cyrl |
| Tatar (Latim) | tt |
| Teso | teo |
| Tetum | tet |
| Tailandês | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonganês | to |
| Tsonga | ts |
| Tswana | tn |
| Turco | tr |
| Turcomeno (Latim) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Uigur (cirílico) | ug-cyrl |
| Ucraniano | uk |
| Alto Sorábio | hsb |
| Urdu | ur |
| Uigur (árabe) | ug |
| Uzbeque (árabe) | uz-arab |
| Uzbeque (cirílico) | uz-cyrl |
| Uzbeque (latim) | uz |
| Vietnamita | vi |
| Volapük | vo |
| Vunjo | vun |
| Walser | wae |
| Galês | cy |
| Frísia Ocidental | fy |
| Wolof | wo |
| Xhosa | xh |
| Maia Yucateco | yua |
| Zapotec | zap |
| Zarma | dje |
| Zhuang | za |
| Zulu | zu |
A tabela seguinte lista o suporte de linguagem do modelo de leitura para extrair e analisar texto impresso.
| Linguagem | Código (opcional) |
|---|---|
| Africâner | af |
| Angika | anp |
| Árabe | ar |
| Asturiano | ast |
| Awadhi | awa |
| Azerbaijano | az |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (latim) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Búlgaro | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Bretão | br |
| Braj | bra |
| Bodo | brx |
| Bósnia | bs |
| Buriate | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Montenegrino (Latim) |
cnr, cnr-latn |
| Montenegrino (cirílico) | cnr-cyrl |
| Corso | co |
| Tártaros da Crimeia | crh |
| Checo | cs |
| Caxubiano | csb |
| Galês | cy |
| Dinamarquês | da |
| Alemão | de |
| Dhimal | dhi |
| Dogri | doi |
| Baixo Sorábio | dsb |
| Inglês | en |
| Espanhol | es |
| Estónio | et |
| Basco | eu |
| Persa | fa |
| Finlandês | fi |
| Filipino | fil |
| Linguagem | Código (opcional) |
|---|---|
| Fijiano | fj |
| Faroês | fo |
| Francês | fr |
| Friulano | fur |
| Frísia Ocidental | fy |
| Irlandês | ga |
| Gagauz | gag |
| Gaélico Escocês | gd |
| Gilbertês | gil |
| Galego | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Havaiano | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Croata | hr |
| Alto Sorábio | hsb |
| Haitiano | ht |
| Húngaro | hu |
| Interlíngua | ia |
| Indonésio | id |
| Islandês | is |
| Italiano | it |
| Inuktitut | iu |
| Japonês | |
| Jaunsari | jns |
| Javanês | jv |
| Kara-Kalpak (Latim) |
kaa, kaa-latn |
| Kara-Kalpak (Cirílico) | kaa-cyrl |
| Kachin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Cazaque (latim) |
kk, kk-latn |
| Cazaque (cirílico) | kk-cyrl |
| Kalaallisut | kl |
| Khaling | klr |
| Malto | kmj |
| Linguagem | Código (opcional) |
|---|---|
| Coreano | |
| Kosraean | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Curdo (latim) |
ku, ku-latn |
| Curdo (árabe) | ku-arab |
| Kumyk | kum |
| Cornish | kw |
| Quirguiz | ky |
| Latim | la |
| Luxemburguês | lb |
| Lakota | lkt |
| Lituano | lt |
| Maori | mi |
| Mongol | mn |
| Marathi | mr |
| Malaio | ms |
| Maltês | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Napolitano | nap |
| Nepali | ne |
| Niueano | niu |
| Holandês | nl |
| Norueguês | no |
| Nogai | nog |
| Occitano | oc |
| Ossétio | os |
| Panjabi | pa |
| Polaco | pl |
| Dari | prs |
| Pachto | ps |
| Português | pt |
| K'iche' | quc |
| Camling | rab |
| Romanche | rm |
| Romeno | ro |
| Russo | ru |
| Sânscrito | sa |
| Santali | sat |
| Linguagem | Código (opcional) |
|---|---|
| Sadri | sck |
| Escoceses | sco |
| Eslovaco | sk |
| Esloveno | sl |
| Samoa | sm |
| Sami do Sul | sma |
| Sami do Norte | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somali | so |
| Albanês | sq |
| Sérvio (latim) |
sr, sr-latn |
| Sirmauri | srx |
| Sueco | sv |
| Suaíli | sw |
| Tetum | tet |
| Tajique | tg |
| Thangmi | thf |
| Turcomanos | tk |
| Tonga | to |
| Turco | tr |
| Tártaro | tt |
| Tuviniano | tyv |
| Uigur | ug |
| Urdu | ur |
| Uzbeque (latim) |
uz, uz-latn |
| Uzbeque (cirílico) | uz-cyrl |
| Uzbeque (árabe) | uz-arab |
| Volapük | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhuang | za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) | zh-hant |
| Zulu | zu |
Disposição
ID do modelo: layout pré-definido
A tabela seguinte lista as línguas suportadas para texto impresso:
| Língua | Código (opcional) |
|---|---|
| Abaza | abq |
| Abkhazo | ab |
| Chinês | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Afar | aa |
| Africâner | af |
| Akan | ak |
| Albanês | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Árabe | ar |
| Asturiano | ast |
| Asu (Tanzânia) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Aymara | ay |
| Azeri (latim) | az |
| Bafia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Bashkir | ba |
| Basco | eu |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (latim) |
be, be-latn |
| Bemba (Zâmbia) | bem |
| Bena (Tanzânia) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bósnio (latim) | bs |
| Brajbha | bra |
| Bretão | br |
| Búlgaro | bg |
| Bundeli | bns |
| Buriate (cirílico) | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Checheno | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chinês Simplificado | zh-Hans |
| Chinês Tradicional | zh-Hant |
| Choctaw | cho |
| Chukot | ckt |
| Chuvash | cv |
| Cornish | kw |
| Corso | co |
| Cree | cr |
| Ribeira | mus |
| Tártaro da Crimeia (latim) | crh |
| Croata | hr |
| Corvo | cro |
| Checo | cs |
| Dinamarquês | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Holandês | nl |
| Efik | efi |
| Inglês | en |
| Erzya (cirílico) | myv |
| Estónio | et |
| Faroês | fo |
| Fijiano | fj |
| Filipino | fil |
| Finlandês | fi |
| Linguagem | Código (opcional) |
|---|---|
Fon |
fon |
| Francês | fr |
| Friulano | fur |
Ga |
gaa |
| Gagauz (latim) | gag |
| Galego | gl |
| Ganda | lg |
| Gayo | gay |
| Alemão | de |
| Gilbertês | gil |
| Gondi (Devanagari) | gon |
| Grego | el |
| Gronelandês | kl |
| Guarani | gn |
| Gurung (Devanagari) | gvr |
| Gusii | guz |
| Crioulo Haitiano | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Havaiano | haw |
| Hebraico | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (latim) | mww |
| Ho (Devanagiri) | hoc |
| Húngaro | hu |
| Iban | iba |
| Islandês | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonésio | id |
| Inguche | inh |
| Interlíngua | ia |
| Inuktitut (Latin) | iu |
| Irlandês | ga |
| Italiano | it |
| Japonês | ja |
| Jaunsari (Devanagari) | Jns |
| Javanês | jv |
| Jola-Fonyi | dyo |
| Kabardiano | kbd |
| Kabuverdianu | kea |
| Kachin (latim) | kac |
| Kalenjin | kln |
| Calmuque | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (Cirílico) | kaa-cyrl |
| Kara-Kalpak (Latim) | kaa |
| Caxubiano | csb |
| Cazaque (cirílico) | kk-cyrl |
| Cazaque (latim) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche' | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Coreano | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraean | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (cirílico) | kum |
| Curdo (árabe) | ku-arab |
| Curdo (latim) | ku-latn |
| Linguagem | Código (opcional) |
|---|---|
| Kurukh (Devanagari) | kru |
| Quirguiz (cirílico) | ky |
Lak |
lbe |
| Lakota | lkt |
| Latim | la |
| Letão | lv |
| Lezghiano | lex |
| Lingala | ln |
| Lituano | lt |
| Baixo Sorábio | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Quénia e Tanzânia) | luo |
| Luxemburguês | lb |
| Luyia | luy |
| Macedónio | mk |
| Machame | jmc |
| Madurês | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaxe | mg |
| Malaio (latim) | ms |
| Maltês | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maori | mi |
| Mapudungun | arn |
| Marathi | mr |
| Mari (Rússia) | chm |
| Masai | mas |
| Mende (Serra Leoa) | men |
| Meru | mer |
| Meta' | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongol (cirílico) | mn |
| Mongondow | mog |
| Montenegrino (cirílico) | cnr-cyrl |
| Montenegrino (Latim) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Nahuatl | nah |
| Navajo | nv |
| Ndonga | ng |
| Napolitano | nap |
| Nepali | ne |
| Ngomba | jgo |
| Niueano | niu |
| Nogay | nog |
| Ndebele do Norte | nd |
| Sami do Norte (latim) | sme |
| Norueguês | no |
| Nyanja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitano | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossética | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Pashto | ps |
| Pedi | nso |
| Persa | fa |
| Polaco | pl |
| Português | pt |
| Punjabi (árabe) | pa |
| Quéchua | qu |
| Ripuariano | ksh |
| Romeno | ro |
| Romanche | rm |
| Rundi | rn |
| Russo | ru |
| Linguagem | Código (opcional) |
|---|---|
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Sakha | sah |
| Samburu | saq |
| Samoa (latim) | sm |
| Sango | sg |
| Sangu (Gabão) | snq |
| Sânscrito (Devanagari) | sa |
| Santali (Devanagiri) | sat |
| Escoceses | sco |
| Gaélico Escocês | gd |
| Sena | seh |
| Sérvio (cirílico) | sr-cyrl |
| Sérvio (latim) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Eslovaco | sk |
| Esloveno | sl |
| Soga | xog |
| Somali (árabe) | so |
| Somali (latim) | so-latn |
| Songhai | son |
| Ndebele do Sul | nr |
| Altai do Sul | alt |
| Sami do Sul | sma |
| Sotho do Sul | st |
| Espanhol | es |
| Sundanês | su |
| Suaíli (latim) | sw |
| Swati | ss |
| Sueco | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Taitiano | ty |
| Taita | dav |
| Tajique (cirílico) | tg |
| Tamil | ta |
| Tártaro (Cirílico) | tt-cyrl |
| Tatar (Latim) | tt |
| Teso | teo |
| Tetum | tet |
| Tailandês | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonganês | to |
| Tsonga | ts |
| Tswana | tn |
| Turco | tr |
| Turcomeno (Latim) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Uigur (cirílico) | ug-cyrl |
| Ucraniano | uk |
| Alto Sorábio | hsb |
| Urdu | ur |
| Uigur (árabe) | ug |
| Uzbeque (árabe) | uz-arab |
| Uzbeque (cirílico) | uz-cyrl |
| Uzbeque (latim) | uz |
| Vietnamita | vi |
| Volapük | vo |
| Vunjo | vun |
| Walser | wae |
| Galês | cy |
| Frísia Ocidental | fy |
| Wolof | wo |
| Xhosa | xh |
| Maia Yucateco | yua |
| Zapotec | zap |
| Zarma | dje |
| Zhuang | za |
| Zulu | zu |
A tabela seguinte lista o suporte à linguagem de modelos de layout para extração e análise de texto impresso .
| Língua | Código (opcional) |
|---|---|
| Africâner | af |
| Angika | anp |
| Árabe | ar |
| Asturiano | ast |
| Awadhi | awa |
| Azerbaijano | az |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (latim) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Búlgaro | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Bretão | br |
| Braj | bra |
| Bodo | brx |
| Bósnia | bs |
| Buriate | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Montenegrino (Latim) |
cnr, cnr-latn |
| Montenegrino (cirílico) | cnr-cyrl |
| Corso | co |
| Tártaros da Crimeia | crh |
| Checo | cs |
| Caxubiano | csb |
| Galês | cy |
| Dinamarquês | da |
| Alemão | de |
| Dhimal | dhi |
| Dogri | doi |
| Baixo Sorábio | dsb |
| Inglês | en |
| Espanhol | es |
| Estónio | et |
| Basco | eu |
| Persa | fa |
| Finlandês | fi |
| Filipino | fil |
| Linguagem | Código (opcional) |
|---|---|
| Fijiano | fj |
| Faroês | fo |
| Francês | fr |
| Friulano | fur |
| Frísia Ocidental | fy |
| Irlandês | ga |
| Gagauz | gag |
| Gaélico Escocês | gd |
| Gilbertês | gil |
| Galego | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Havaiano | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Croata | hr |
| Alto Sorábio | hsb |
| Haitiano | ht |
| Húngaro | hu |
| Interlíngua | ia |
| Indonésio | id |
| Islandês | is |
| Italiano | it |
| Inuktitut | iu |
| Japonês | |
| Jaunsari | jns |
| Javanês | jv |
| Kara-Kalpak (Latim) |
kaa, kaa-latn |
| Kara-Kalpak (Cirílico) | kaa-cyrl |
| Kachin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Cazaque (latim) |
kk, kk-latn |
| Cazaque (cirílico) | kk-cyrl |
| Kalaallisut | kl |
| Khaling | klr |
| Malto | kmj |
| Linguagem | Código (opcional) |
|---|---|
| Coreano | |
| Kosraean | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Curdo (latim) |
ku, ku-latn |
| Curdo (árabe) | ku-arab |
| Kumyk | kum |
| Cornish | kw |
| Quirguiz | ky |
| Latim | la |
| Luxemburguês | lb |
| Lakota | lkt |
| Lituano | lt |
| Maori | mi |
| Mongol | mn |
| Marathi | mr |
| Malaio | ms |
| Maltês | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Napolitano | nap |
| Nepali | ne |
| Niueano | niu |
| Holandês | nl |
| Norueguês | no |
| Nogai | nog |
| Occitano | oc |
| Ossétio | os |
| Panjabi | pa |
| Polaco | pl |
| Dari | prs |
| Pachto | ps |
| Português | pt |
| K'iche' | quc |
| Camling | rab |
| Romanche | rm |
| Romeno | ro |
| Russo | ru |
| Sânscrito | sa |
| Santali | sat |
| Linguagem | Código (opcional) |
|---|---|
| Sadri | sck |
| Escoceses | sco |
| Eslovaco | sk |
| Esloveno | sl |
| Samoa | sm |
| Sami do Sul | sma |
| Sami do Norte | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somali | so |
| Albanês | sq |
| Sérvio (latim) |
sr, sr-latn |
| Sirmauri | srx |
| Sueco | sv |
| Suaíli | sw |
| Tetum | tet |
| Tajique | tg |
| Thangmi | thf |
| Turcomanos | tk |
| Tonga | to |
| Turco | tr |
| Tártaro | tt |
| Tuviniano | tyv |
| Uigur | ug |
| Urdu | ur |
| Uzbeque (latim) |
uz, uz-latn |
| Uzbeque (cirílico) | uz-cyrl |
| Uzbeque (árabe) | uz-arab |
| Volapük | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhuang | za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) | zh-hant |
| Zulu | zu |
| Linguagem | Código da língua |
|---|---|
| Africâner | af |
| Albanês | sq |
| Asturiano | ast |
| Basco | eu |
| Bislama | bi |
| Bretão | br |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Chinês (Simplificado) | zh-Hans |
| Chinês (Tradicional) | zh-Hant |
| Cornish | kw |
| Corso | co |
| Tártaro da Crimeia (latim) | crh |
| Checo | cs |
| Dinamarquês | da |
| Holandês | nl |
| Inglês (impresso e manuscrito) | en |
| Estónio | et |
| Fijiano | fj |
| Filipino | fil |
| Finlandês | fi |
| Francês | fr |
| Friulano | fur |
| Galego | gl |
| Alemão | de |
| Gilbertês | gil |
| Gronelandês | kl |
| Crioulo Haitiano | ht |
| Hani | hni |
| Hmong Daw (latim) | mww |
| Húngaro | hu |
| Indonésio | id |
| Interlíngua | ia |
| Inuktitut (Latin) | iu |
| Irlandês | ga |
| Linguagem | Código da língua |
|---|---|
| Italiano | it |
| Japonês | ja |
| Javanês | jv |
| K'iche' | quc |
| Kabuverdianu | kea |
| Kachin (latim) | kac |
| Kara-Kalpak | kaa |
| Caxubiano | csb |
| Khasi | kha |
| Coreano | ko |
| Curdo (latim) | kur |
| Luxemburguês | lb |
| Malaio (latim) | ms |
| Manx | gv |
| Napolitano | nap |
| Norueguês | no |
| Occitano | oc |
| Polaco | pl |
| Português | pt |
| Romanche | rm |
| Escoceses | sco |
| Gaélico Escocês | gd |
| Esloveno | slv |
| Espanhol | es |
| Suaíli (latim) | sw |
| Sueco | sv |
| Tatar (Latim) | tat |
| Tetum | tet |
| Turco | tr |
| Alto Sorábio | hsb |
| Uzbeque (latim) | uz |
| Volapük | vo |
| Walser | wae |
| Frísia Ocidental | fy |
| Maia Yucateco | yua |
| Zhuang | za |
| Zulu | zu |
Documento geral
Importante
Com o Document Intelligence v4.0:2024-11-30 (GA), o modelo geral de documento (documento pré-definido) está a ser adicionado ao layout (layout pré-definido). Para extrair pares-chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, utilize os seguintes modelos:
| Pares-chave-valor | versão | ID do modelo |
|---|---|---|
Modelo de layout com a string features=keyValuePairs de consulta especificada. |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Modelo geral de documentos | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
ID do modelo: documento pré-construído
A tabela seguinte lista o suporte geral para linguagens de modelos de documentos.
Modelo ID |
Língua — Código local | Padrão |
|---|---|---|
| documento pré-construído | Inglês (EUA)—en-US |
Inglês (Estados Unidos)—en-US |