Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este conteúdo se aplica a:
v4.0 (GA) | Versões anteriores:
v3.1 (GA)
v3.0 (desativação)
v2.1 (desativação)
Este conteúdo se aplica a:
v3.0 (desativação) | Versões mais recentes:
v4.0 (GA)
v3.1 | Versão anterior:
v2.1 (desativação)
Esse conteúdo se aplica a:
v2.1 | Versão mais recente:
v4.0 (GA)
Azure Document Intelligence nos modelos de Foundry Tools fornecem suporte ao processamento de documentos multilíngues. Nossos recursos de suporte de linguagem permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, uso ou progresso da sua organização. As tabelas a seguir listam o idioma e o suporte à localidade disponíveis por modelo e recurso:
- Leia: O modelo de leitura permite a extração e a análise de texto impresso e manuscrito. Esse modelo é o mecanismo OCR subjacente para outros modelos predefinidos do Document Intelligence, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para obter mais informações, consulteRead model overview
- Layout: O modelo de layout permite a extração e análise de texto, tabelas, estrutura de documentos e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
- Documento geral: O modelo de documento geral permite a extração e a análise de texto, estrutura do documento e pares chave-valor. Para obter mais informações, consulteVisão geral do modelo de documento
Nota
Código de idioma opcional
Os modelos universais baseados em aprendizado profundo do Document Intelligence extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.
Além disso, não é necessário especificar uma localidade. Esse é um parâmetro opcional. A tecnologia de aprendizado profundo do Document Intelligence detectará automaticamente a linguagem de texto em sua imagem.
Modelo de leitura
ID do modelo: prebuilt-read
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
| Linguagem | Código (opcional) |
|---|---|
| Abaza | abq |
| Abecásia | ab |
| Achinese | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Longe | aa |
| Africâner | af |
| Akan | ak |
| Albanês | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Árabe | ar |
| Asturiano | ast |
| Asu (Tanzânia) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Aimará | ay |
| Azerbaijão (Latino) | az |
| Bafia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Bashkir | ba |
| Basco | eu |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (alfabeto latino) |
be, be-latn |
| Bemba (Zâmbia) | bem |
| Bena (Tanzânia) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bósnio (Latino) | bs |
| Brajbha | bra |
| Breton | br |
| Búlgaro | bg |
| Bundeli | bns |
| Buryat (cirílico) | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Checheno | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chinês simplificado | zh-Hans |
| Chinês tradicional | zh-Hant |
| Choctaw | cho |
| Chukot | ckt |
| Chuvash | cv |
| córnico | kw |
| Córsico | co |
| Cree | cr |
| Creek | mus |
| Tártaro Crimeano (Latim) | crh |
| Croata | hr |
| Corvo | cro |
| Tcheco | cs |
| Dinamarquês | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Holandês | nl |
| Efik | efi |
| Inglês | en |
| Erzya (cirílico) | myv |
| Estoniano | et |
| Faroês | fo |
| Fijiano | fj |
| Filipinas | fil |
| Finlandês | fi |
| Linguagem | Código (opcional) |
|---|---|
Fon |
fon |
| Francês | fr |
| Friulian | fur |
Ga |
gaa |
| Gagauz (Latim) | gag |
| Galego | gl |
| Ganda | lg |
| Gayo | gay |
| Alemão | de |
| Gilbertês | gil |
| Gondi (Devanagari) | gon |
| Grego | el |
| Groenlandês | kl |
| Guarani | gn |
| Gurung (Devanagari) | gvr |
| Gusii | guz |
| Crioulo Haitiano | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Havaiano | haw |
| Hebraico | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (latim) | mww |
| Ho(Devanagiri) | hoc |
| Húngaro | hu |
| Iban | iba |
| Islandês | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonésio | id |
| Ingush | inh |
| Interlíngua | ia |
| Inuktitut (latino) | iu |
| Irlandês | ga |
| Italiano | it |
| Japonês | ja |
| Jaunsari (Devanagari) | Jns |
| Javanês | jv |
| Jola-Fonyi | dyo |
| Kabardiano | kbd |
| Kabuverdianu | kea |
| Kachin (Latim) | kac |
| Kalenjin | kln |
| Kalmyk | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kara-Kalpak (latino) | kaa |
| Kashubian | csb |
| Cazaque (Cirílico) | kk-cyrl |
| Cazaque (latino) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche' | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Coreano | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraano | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (cirílico) | kum |
| Curdo (árabe) | ku-arab |
| Curdo (Latim) | ku-latn |
| Kurukh (Devanagari) | kru |
| Quirguistão (cirílico) | ky |
Lak |
lbe |
| Lakota | lkt |
| Linguagem | Código (opcional) |
|---|---|
| Latina | la |
| Letão | lv |
| Lezghian | lex |
| Lingala | ln |
| Lituano | lt |
| Sorbian inferior | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Quênia e Tanzânia) | luo |
| Luxemburguês | lb |
| Luyia | luy |
| Macedónio | mk |
| Machame | jmc |
| Madurese | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaxe | mg |
| Malaio (latino) | ms |
| Maltês | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maori | mi |
| Mapudungun | arn |
| Marati | mr |
| Mari (Rússia) | chm |
| Masai | mas |
| Mende (Serra Leoa) | men |
| Meru | mer |
| Meta' | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongol (cirílico) | mn |
| Mongondow | mog |
| Montenegrino (cirílico) | cnr-cyrl |
| Montenegrino (latino) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Nahuatl | nah |
| Navajo | nv |
| Ndonga | ng |
| Napolitano | nap |
| Nepalês | ne |
| Ngomba | jgo |
| Niueano | niu |
| Nogay | nog |
| North Ndebele | nd |
| Sami do Norte (Latino) | sme |
| Norueguês | no |
| Nianja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitânico | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossético | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Pachto | ps |
| Pedi | nso |
| Persa | fa |
| Polonês | pl |
| Português | pt |
| Punjabi (árabe) | pa |
| Quíchua | qu |
| Ripuário | ksh |
| Romeno | ro |
| Romanche | rm |
| Rundi | rn |
| Russo | ru |
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Sakha | sah |
| Samburu | saq |
| Samoano (alfabeto latino) | sm |
| Sango | sg |
| Linguagem | Código (opcional) |
|---|---|
| Sangu (Gabão) | snq |
| Sânscrito (Devanagari) | sa |
| Santali(Devanagiri) | sat |
| Escoceses | sco |
| Gaélico escocês | gd |
| Sena | seh |
| Sérvio (Cirílico) | sr-cyrl |
| Sérvio (latino) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Eslovaco | sk |
| Esloveno | sl |
| Soga | xog |
| Somali (árabe) | so |
| Somali (Latim) | so-latn |
| Songhai | son |
| Ndebele do Sul | nr |
| Altai do Sul | alt |
| Sami do Sul | sma |
| Sotho do Sul | st |
| Espanhol | es |
| Sundanês | su |
| Swahili (latim) | sw |
| Swati | ss |
| Sueco | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Taitiano | ty |
| Taita | dav |
| Tajique (cirílico) | tg |
| Tâmil | ta |
| Tatar (Cirílico) | tt-cyrl |
| Tatar (latino) | tt |
| Teso | teo |
| Tetum | tet |
| Tailandês | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonga | to |
| Tsonga | ts |
| Tswana | tn |
| Turco | tr |
| Turcomeno (Latim) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Uigure (cirílico) | ug-cyrl |
| Ucraniano | uk |
| Alto Sorábio | hsb |
| Urdu | ur |
| Uigure (árabe) | ug |
| Uzbeque (árabe) | uz-arab |
| Uzbeque (Cirílico) | uz-cyrl |
| Uzbeque (latino) | uz |
| Vietnamita | vi |
| Volapuque | vo |
| Vunjo | vun |
| Walser | wae |
| Galês | cy |
| Frísia Ocidental | fy |
| Wolof | wo |
| Xhosa | xh |
| Yucatec Maya | yua |
| Zapoteca | zap |
| Zarma | dje |
| Zhuang | za |
| Zulu | zu |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
| Linguagem | Código (opcional) |
|---|---|
| Africâner | af |
| Angika | anp |
| Árabe | ar |
| Asturiano | ast |
| Awadhi | awa |
| Azerbaijão | az |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (alfabeto latino) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Búlgaro | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Breton | br |
| Braj | bra |
| Bodo | brx |
| Bósnio | bs |
| Buriat | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Montenegrino (latino) |
cnr, cnr-latn |
| Montenegrino (cirílico) | cnr-cyrl |
| Córsico | co |
| Tártaro da Criméia | crh |
| Tcheco | cs |
| Kashubian | csb |
| Galês | cy |
| Dinamarquês | da |
| Alemão | de |
| Dhimal | dhi |
| Dogri | doi |
| Sorbian inferior | dsb |
| Inglês | en |
| Espanhol | es |
| Estoniano | et |
| Basco | eu |
| Persa | fa |
| Finlandês | fi |
| Filipinas | fil |
| Linguagem | Código (opcional) |
|---|---|
| Fijiano | fj |
| Faroês | fo |
| Francês | fr |
| Friulian | fur |
| Frísia Ocidental | fy |
| Irlandês | ga |
| Gagauz | gag |
| Gaélico escocês | gd |
| Gilbertês | gil |
| Galego | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Havaiano | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Croata | hr |
| Alto Sorábio | hsb |
| Haitiano | ht |
| Húngaro | hu |
| Interlíngua | ia |
| Indonésio | id |
| Islandês | is |
| Italiano | it |
| Inuktitut | iu |
| Japonês | |
| Jaunsari | jns |
| Javanês | jv |
| Kara-Kalpak (latino) |
kaa, kaa-latn |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kachin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Cazaque (latino) |
kk, kk-latn |
| Cazaque (Cirílico) | kk-cyrl |
| Kalaallisut | kl |
| Khaling | klr |
| Malto | kmj |
| Linguagem | Código (opcional) |
|---|---|
| Coreano | |
| Kosraano | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Curdo (Latim) |
ku, ku-latn |
| Curdo (árabe) | ku-arab |
| Kumyk | kum |
| córnico | kw |
| Quirguiz | ky |
| Latina | la |
| Luxemburguês | lb |
| Lakota | lkt |
| Lituano | lt |
| Maori | mi |
| Mongol | mn |
| Marati | mr |
| Malaio | ms |
| Maltês | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Napolitano | nap |
| Nepalês | ne |
| Niueano | niu |
| Holandês | nl |
| Norueguês | no |
| Nogai | nog |
| Occitânico | oc |
| Ossétio | os |
| Panjabi | pa |
| Polonês | pl |
| Dari | prs |
| Pushto | ps |
| Português | pt |
| K'iche' | quc |
| Camling | rab |
| Romanche | rm |
| Romeno | ro |
| Russo | ru |
| Sânscrito | sa |
| Santali | sat |
| Linguagem | Código (opcional) |
|---|---|
| Sadri | sck |
| Escoceses | sco |
| Eslovaco | sk |
| Esloveno | sl |
| Samoano | sm |
| Sami do Sul | sma |
| Sami do Norte | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somali | so |
| Albanês | sq |
| Sérvio (latino) |
sr, sr-latn |
| Sirmauri | srx |
| Sueco | sv |
| Suaíli | sw |
| Tetum | tet |
| Tadjique | tg |
| Thangmi | thf |
| Turcomeno | tk |
| Tonga | to |
| Turco | tr |
| Tártaro | tt |
| Tuviniano | tyv |
| Uighur | ug |
| Urdu | ur |
| Uzbeque (latino) |
uz, uz-latn |
| Uzbeque (Cirílico) | uz-cyrl |
| Uzbeque (árabe) | uz-arab |
| Volapuque | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhuang | za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) | zh-hant |
| Zulu | zu |
Layout
ID do modelo: layout predefinido
A tabela a seguir lista os idiomas com suporte para texto impresso:
| Língua | Código (opcional) |
|---|---|
| Abaza | abq |
| Abecásia | ab |
| Achinese | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Longe | aa |
| Africâner | af |
| Akan | ak |
| Albanês | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Árabe | ar |
| Asturiano | ast |
| Asu (Tanzânia) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Aimará | ay |
| Azerbaijão (Latino) | az |
| Bafia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Bashkir | ba |
| Basco | eu |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (alfabeto latino) |
be, be-latn |
| Bemba (Zâmbia) | bem |
| Bena (Tanzânia) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bósnio (Latino) | bs |
| Brajbha | bra |
| Breton | br |
| Búlgaro | bg |
| Bundeli | bns |
| Buryat (cirílico) | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Checheno | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chinês simplificado | zh-Hans |
| Chinês tradicional | zh-Hant |
| Choctaw | cho |
| Chukot | ckt |
| Chuvash | cv |
| córnico | kw |
| Córsico | co |
| Cree | cr |
| Creek | mus |
| Tártaro Crimeano (Latim) | crh |
| Croata | hr |
| Corvo | cro |
| Tcheco | cs |
| Dinamarquês | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Holandês | nl |
| Efik | efi |
| Inglês | en |
| Erzya (cirílico) | myv |
| Estoniano | et |
| Faroês | fo |
| Fijiano | fj |
| Filipinas | fil |
| Finlandês | fi |
| Linguagem | Código (opcional) |
|---|---|
Fon |
fon |
| Francês | fr |
| Friulian | fur |
Ga |
gaa |
| Gagauz (Latim) | gag |
| Galego | gl |
| Ganda | lg |
| Gayo | gay |
| Alemão | de |
| Gilbertês | gil |
| Gondi (Devanagari) | gon |
| Grego | el |
| Groenlandês | kl |
| Guarani | gn |
| Gurung (Devanagari) | gvr |
| Gusii | guz |
| Crioulo Haitiano | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Havaiano | haw |
| Hebraico | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (latim) | mww |
| Ho(Devanagiri) | hoc |
| Húngaro | hu |
| Iban | iba |
| Islandês | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonésio | id |
| Ingush | inh |
| Interlíngua | ia |
| Inuktitut (latino) | iu |
| Irlandês | ga |
| Italiano | it |
| Japonês | ja |
| Jaunsari (Devanagari) | Jns |
| Javanês | jv |
| Jola-Fonyi | dyo |
| Kabardiano | kbd |
| Kabuverdianu | kea |
| Kachin (Latim) | kac |
| Kalenjin | kln |
| Kalmyk | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kara-Kalpak (latino) | kaa |
| Kashubian | csb |
| Cazaque (Cirílico) | kk-cyrl |
| Cazaque (latino) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche' | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Coreano | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraano | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (cirílico) | kum |
| Curdo (árabe) | ku-arab |
| Curdo (Latim) | ku-latn |
| Linguagem | Código (opcional) |
|---|---|
| Kurukh (Devanagari) | kru |
| Quirguistão (cirílico) | ky |
Lak |
lbe |
| Lakota | lkt |
| Latina | la |
| Letão | lv |
| Lezghian | lex |
| Lingala | ln |
| Lituano | lt |
| Sorbian inferior | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Quênia e Tanzânia) | luo |
| Luxemburguês | lb |
| Luyia | luy |
| Macedónio | mk |
| Machame | jmc |
| Madurese | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaxe | mg |
| Malaio (latino) | ms |
| Maltês | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maori | mi |
| Mapudungun | arn |
| Marati | mr |
| Mari (Rússia) | chm |
| Masai | mas |
| Mende (Serra Leoa) | men |
| Meru | mer |
| Meta' | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongol (cirílico) | mn |
| Mongondow | mog |
| Montenegrino (cirílico) | cnr-cyrl |
| Montenegrino (latino) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Nahuatl | nah |
| Navajo | nv |
| Ndonga | ng |
| Napolitano | nap |
| Nepalês | ne |
| Ngomba | jgo |
| Niueano | niu |
| Nogay | nog |
| North Ndebele | nd |
| Sami do Norte (Latino) | sme |
| Norueguês | no |
| Nianja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitânico | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossético | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Pachto | ps |
| Pedi | nso |
| Persa | fa |
| Polonês | pl |
| Português | pt |
| Punjabi (árabe) | pa |
| Quíchua | qu |
| Ripuário | ksh |
| Romeno | ro |
| Romanche | rm |
| Rundi | rn |
| Russo | ru |
| Linguagem | Código (opcional) |
|---|---|
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Sakha | sah |
| Samburu | saq |
| Samoano (alfabeto latino) | sm |
| Sango | sg |
| Sangu (Gabão) | snq |
| Sânscrito (Devanagari) | sa |
| Santali(Devanagiri) | sat |
| Escoceses | sco |
| Gaélico escocês | gd |
| Sena | seh |
| Sérvio (Cirílico) | sr-cyrl |
| Sérvio (latino) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Eslovaco | sk |
| Esloveno | sl |
| Soga | xog |
| Somali (árabe) | so |
| Somali (Latim) | so-latn |
| Songhai | son |
| Ndebele do Sul | nr |
| Altai do Sul | alt |
| Sami do Sul | sma |
| Sotho do Sul | st |
| Espanhol | es |
| Sundanês | su |
| Swahili (latim) | sw |
| Swati | ss |
| Sueco | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Taitiano | ty |
| Taita | dav |
| Tajique (cirílico) | tg |
| Tâmil | ta |
| Tatar (Cirílico) | tt-cyrl |
| Tatar (latino) | tt |
| Teso | teo |
| Tetum | tet |
| Tailandês | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonga | to |
| Tsonga | ts |
| Tswana | tn |
| Turco | tr |
| Turcomeno (Latim) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Uigure (cirílico) | ug-cyrl |
| Ucraniano | uk |
| Alto Sorábio | hsb |
| Urdu | ur |
| Uigure (árabe) | ug |
| Uzbeque (árabe) | uz-arab |
| Uzbeque (Cirílico) | uz-cyrl |
| Uzbeque (latino) | uz |
| Vietnamita | vi |
| Volapuque | vo |
| Vunjo | vun |
| Walser | wae |
| Galês | cy |
| Frísia Ocidental | fy |
| Wolof | wo |
| Xhosa | xh |
| Yucatec Maya | yua |
| Zapoteca | zap |
| Zarma | dje |
| Zhuang | za |
| Zulu | zu |
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto impresso .
| Língua | Código (opcional) |
|---|---|
| Africâner | af |
| Angika | anp |
| Árabe | ar |
| Asturiano | ast |
| Awadhi | awa |
| Azerbaijão | az |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (alfabeto latino) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Búlgaro | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Breton | br |
| Braj | bra |
| Bodo | brx |
| Bósnio | bs |
| Buriat | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Montenegrino (latino) |
cnr, cnr-latn |
| Montenegrino (cirílico) | cnr-cyrl |
| Córsico | co |
| Tártaro da Criméia | crh |
| Tcheco | cs |
| Kashubian | csb |
| Galês | cy |
| Dinamarquês | da |
| Alemão | de |
| Dhimal | dhi |
| Dogri | doi |
| Sorbian inferior | dsb |
| Inglês | en |
| Espanhol | es |
| Estoniano | et |
| Basco | eu |
| Persa | fa |
| Finlandês | fi |
| Filipinas | fil |
| Linguagem | Código (opcional) |
|---|---|
| Fijiano | fj |
| Faroês | fo |
| Francês | fr |
| Friulian | fur |
| Frísia Ocidental | fy |
| Irlandês | ga |
| Gagauz | gag |
| Gaélico escocês | gd |
| Gilbertês | gil |
| Galego | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Havaiano | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Croata | hr |
| Alto Sorábio | hsb |
| Haitiano | ht |
| Húngaro | hu |
| Interlíngua | ia |
| Indonésio | id |
| Islandês | is |
| Italiano | it |
| Inuktitut | iu |
| Japonês | |
| Jaunsari | jns |
| Javanês | jv |
| Kara-Kalpak (latino) |
kaa, kaa-latn |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kachin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Cazaque (latino) |
kk, kk-latn |
| Cazaque (Cirílico) | kk-cyrl |
| Kalaallisut | kl |
| Khaling | klr |
| Malto | kmj |
| Linguagem | Código (opcional) |
|---|---|
| Coreano | |
| Kosraano | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Curdo (Latim) |
ku, ku-latn |
| Curdo (árabe) | ku-arab |
| Kumyk | kum |
| córnico | kw |
| Quirguiz | ky |
| Latina | la |
| Luxemburguês | lb |
| Lakota | lkt |
| Lituano | lt |
| Maori | mi |
| Mongol | mn |
| Marati | mr |
| Malaio | ms |
| Maltês | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Napolitano | nap |
| Nepalês | ne |
| Niueano | niu |
| Holandês | nl |
| Norueguês | no |
| Nogai | nog |
| Occitânico | oc |
| Ossétio | os |
| Panjabi | pa |
| Polonês | pl |
| Dari | prs |
| Pushto | ps |
| Português | pt |
| K'iche' | quc |
| Camling | rab |
| Romanche | rm |
| Romeno | ro |
| Russo | ru |
| Sânscrito | sa |
| Santali | sat |
| Linguagem | Código (opcional) |
|---|---|
| Sadri | sck |
| Escoceses | sco |
| Eslovaco | sk |
| Esloveno | sl |
| Samoano | sm |
| Sami do Sul | sma |
| Sami do Norte | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somali | so |
| Albanês | sq |
| Sérvio (latino) |
sr, sr-latn |
| Sirmauri | srx |
| Sueco | sv |
| Suaíli | sw |
| Tetum | tet |
| Tadjique | tg |
| Thangmi | thf |
| Turcomeno | tk |
| Tonga | to |
| Turco | tr |
| Tártaro | tt |
| Tuviniano | tyv |
| Uighur | ug |
| Urdu | ur |
| Uzbeque (latino) |
uz, uz-latn |
| Uzbeque (Cirílico) | uz-cyrl |
| Uzbeque (árabe) | uz-arab |
| Volapuque | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhuang | za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) | zh-hant |
| Zulu | zu |
| Linguagem | Código de idioma |
|---|---|
| Africâner | af |
| Albanês | sq |
| Asturiano | ast |
| Basco | eu |
| Bislama | bi |
| Breton | br |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Chinês (simplificado) | zh-Hans |
| Chinês (Tradicional) | zh-Hant |
| córnico | kw |
| Córsico | co |
| Tártaro da Crimeia (latim) | crh |
| Tcheco | cs |
| Dinamarquês | da |
| Holandês | nl |
| Inglês (impresso e manuscrito) | en |
| Estoniano | et |
| Fijiano | fj |
| Filipinas | fil |
| Finlandês | fi |
| Francês | fr |
| Friulian | fur |
| Galego | gl |
| Alemão | de |
| Gilbertês | gil |
| Groenlandês | kl |
| Crioulo Haitiano | ht |
| Hani | hni |
| Hmong Daw (latim) | mww |
| Húngaro | hu |
| Indonésio | id |
| Interlíngua | ia |
| Inuktitut (latino) | iu |
| Irlandês | ga |
| Linguagem | Código de idioma |
|---|---|
| Italiano | it |
| Japonês | ja |
| Javanês | jv |
| K'iche' | quc |
| Kabuverdianu | kea |
| Kachin (Latim) | kac |
| Kara-Kalpak | kaa |
| Kashubian | csb |
| Khasi | kha |
| Coreano | ko |
| Curdo (latim) | kur |
| Luxemburguês | lb |
| Malaio (latino) | ms |
| Manx | gv |
| Napolitano | nap |
| Norueguês | no |
| Occitânico | oc |
| Polonês | pl |
| Português | pt |
| Romanche | rm |
| Escoceses | sco |
| Gaélico escocês | gd |
| Esloveno | slv |
| Espanhol | es |
| Swahili (latim) | sw |
| Sueco | sv |
| Tatar (latin) | tat |
| Tetum | tet |
| Turco | tr |
| Alto Sorábio | hsb |
| Uzbeque (latino) | uz |
| Volapuque | vo |
| Walser | wae |
| Frísia Ocidental | fy |
| Yucatec Maya | yua |
| Zhuang | za |
| Zulu | zu |
Documento geral
Importante
Com o Document Intelligence v4.0:2024-11-30 (GA), o modelo geral de documento (prebuilt-document) está sendo integrado ao layout (prebuilt-layout). Para extrair pares chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, use os seguintes modelos:
| Pares de valor de chave | versão | ID do modelo |
|---|---|---|
Modelo de layout com string de consulta features=keyValuePairs especificada. |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Modelo de documento geral | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
ID do modelo: documento predefinido
A tabela a seguir lista o suporte geral ao idioma do modelo de documento.
Modelo ID |
Idioma – Código de localidade | Padrão |
|---|---|---|
| documento predefinido | Inglês (Estados Unidos)— en-US |
Inglês (Estados Unidos)—en-US |