Suporte ao idioma: análise de documentos

Este conteúdo se aplica a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (desativação)red-checkmarkv2.1 (desativação)

Este conteúdo se aplica a:checkmarkv3.1 (GA) | Versão mais recente:purple-checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este conteúdo se aplica a:red-checkmarkv3.0 (desativação) | Versões mais recentes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versão anterior:blue-checkmarkv2.1 (desativação)

Esse conteúdo se aplica a:red-checkmarkv2.1 | Versão mais recente:blue-checkmarkv4.0 (GA)

Azure Document Intelligence nos modelos de Foundry Tools fornecem suporte ao processamento de documentos multilíngues. Nossos recursos de suporte de linguagem permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, uso ou progresso da sua organização. As tabelas a seguir listam o idioma e o suporte à localidade disponíveis por modelo e recurso:

  • Leia: O modelo de leitura permite a extração e a análise de texto impresso e manuscrito. Esse modelo é o mecanismo OCR subjacente para outros modelos predefinidos do Document Intelligence, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para obter mais informações, consulteRead model overview
  • Layout: O modelo de layout permite a extração e análise de texto, tabelas, estrutura de documentos e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.

Nota

Código de idioma opcional

  • Os modelos universais baseados em aprendizado profundo do Document Intelligence extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.

  • Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.

  • Além disso, não é necessário especificar uma localidade. Esse é um parâmetro opcional. A tecnologia de aprendizado profundo do Document Intelligence detectará automaticamente a linguagem de texto em sua imagem.

Modelo de leitura

ID do modelo: prebuilt-read

A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .

Linguagem Código (opcional)
Abaza abq
Abecásia ab
Achinese ace
Acoli ach
Adangme ada
Adyghe ady
Longe aa
Africâner af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aimará ay
Azerbaijão (Latino) az
Bafia ksf
Bagheli bfy
Bambara bm
Bashkir ba
Basco eu
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (alfabeto latino) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (Latino) bs
Brajbha bra
Breton br
Búlgaro bg
Bundeli bns
Buryat (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chinês simplificado zh-Hans
Chinês tradicional zh-Hant
Choctaw cho
Chukot ckt
Chuvash cv
córnico kw
Córsico co
Cree cr
Creek mus
Tártaro Crimeano (Latim) crh
Croata hr
Corvo cro
Tcheco cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Holandês nl
Efik efi
Inglês en
Erzya (cirílico) myv
Estoniano et
Faroês fo
Fijiano fj
Filipinas fil
Finlandês fi
Linguagem Código (opcional)
Fon fon
Francês fr
Friulian fur
Ga gaa
Gagauz (Latim) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertês gil
Gondi (Devanagari) gon
Grego el
Groenlandês kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo Haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (latim) mww
Ho(Devanagiri) hoc
Húngaro hu
Iban iba
Islandês is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésio id
Ingush inh
Interlíngua ia
Inuktitut (latino) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardiano kbd
Kabuverdianu kea
Kachin (Latim) kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (cirílico) kaa-cyrl
Kara-Kalpak (latino) kaa
Kashubian csb
Cazaque (Cirílico) kk-cyrl
Cazaque (latino) kk-latn
Khakas kjh
Khaling klr
Khasi kha
K'iche' quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
Koryak kpy
Kosraano kos
Kpelle kpe
Kuanyama kj
Kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (Latim) ku-latn
Kurukh (Devanagari) kru
Quirguistão (cirílico) ky
Lak lbe
Lakota lkt
Linguagem Código (opcional)
Latina la
Letão lv
Lezghian lex
Lingala ln
Lituano lt
Sorbian inferior dsb
Lozi loz
Lule Sami smj
Luo (Quênia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedónio mk
Machame jmc
Madurese mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (latino) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marati mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) men
Meru mer
Meta' mgo
Minangkabau min
Mohawk moh
Mongol (cirílico) mn
Mongondow mog
Montenegrino (cirílico) cnr-cyrl
Montenegrino (latino) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitano nap
Nepalês ne
Ngomba jgo
Niueano niu
Nogay nog
North Ndebele nd
Sami do Norte (Latino) sme
Norueguês no
Nianja ny
Nyankole nyn
Nzima nzi
Occitânico oc
Ojibwa oj
Oromo om
Ossético os
Pampanga pam
Pangasinan pag
Papiamento pap
Pachto ps
Pedi nso
Persa fa
Polonês pl
Português pt
Punjabi (árabe) pa
Quíchua qu
Ripuário ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoano (alfabeto latino) sm
Sango sg
Linguagem Código (opcional)
Sangu (Gabão) snq
Sânscrito (Devanagari) sa
Santali(Devanagiri) sat
Escoceses sco
Gaélico escocês gd
Sena seh
Sérvio (Cirílico) sr-cyrl
Sérvio (latino) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) so
Somali (Latim) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
Sami do Sul sma
Sotho do Sul st
Espanhol es
Sundanês su
Swahili (latim) sw
Swati ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tajique (cirílico) tg
Tâmil ta
Tatar (Cirílico) tt-cyrl
Tatar (latino) tt
Teso teo
Tetum tet
Tailandês th
Thangmi thf
Tok Pisin tpi
Tonga to
Tsonga ts
Tswana tn
Turco tr
Turcomeno (Latim) tk
Tuvan tyv
Udmurt udm
Uigure (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio hsb
Urdu ur
Uigure (árabe) ug
Uzbeque (árabe) uz-arab
Uzbeque (Cirílico) uz-cyrl
Uzbeque (latino) uz
Vietnamita vi
Volapuque vo
Vunjo vun
Walser wae
Galês cy
Frísia Ocidental fy
Wolof wo
Xhosa xh
Yucatec Maya yua
Zapoteca zap
Zarma dje
Zhuang za
Zulu zu

A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .

Linguagem Código (opcional)
Africâner af
Angika anp
Árabe ar
Asturiano ast
Awadhi awa
Azerbaijão az
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (alfabeto latino) be-latn
Bagheli bfy
Mahasu Pahari bfz
Búlgaro bg
Haryanvi bgc
Bhojpuri bho
Bislama bi
Bundeli bns
Breton br
Braj bra
Bodo brx
Bósnio bs
Buriat bua
Catalão ca
Cebuano ceb
Chamorro ch
Montenegrino (latino) cnr, cnr-latn
Montenegrino (cirílico) cnr-cyrl
Córsico co
Tártaro da Criméia crh
Tcheco cs
Kashubian csb
Galês cy
Dinamarquês da
Alemão de
Dhimal dhi
Dogri doi
Sorbian inferior dsb
Inglês en
Espanhol es
Estoniano et
Basco eu
Persa fa
Finlandês fi
Filipinas fil
Linguagem Código (opcional)
Fijiano fj
Faroês fo
Francês fr
Friulian fur
Frísia Ocidental fy
Irlandês ga
Gagauz gag
Gaélico escocês gd
Gilbertês gil
Galego gl
Gondi gon
Manx gv
Gurung gvr
Havaiano haw
Hindi hi
Halbi hlb
Chhattisgarhi hne
Hani hni
Ho hoc
Croata hr
Alto Sorábio hsb
Haitiano ht
Húngaro hu
Interlíngua ia
Indonésio id
Islandês is
Italiano it
Inuktitut iu
Japonês
Jaunsari jns
Javanês jv
Kara-Kalpak (latino) kaa, kaa-latn
Kara-Kalpak (cirílico) kaa-cyrl
Kachin kac
Kabuverdianu kea
Korku kfq
Khasi kha
Cazaque (latino) kk, kk-latn
Cazaque (Cirílico) kk-cyrl
Kalaallisut kl
Khaling klr
Malto kmj
Linguagem Código (opcional)
Coreano
Kosraano kos
Koryak kpy
Karachay-Balkar krc
Kurukh kru
Kölsch ksh
Curdo (Latim) ku, ku-latn
Curdo (árabe) ku-arab
Kumyk kum
córnico kw
Quirguiz ky
Latina la
Luxemburguês lb
Lakota lkt
Lituano lt
Maori mi
Mongol mn
Marati mr
Malaio ms
Maltês mt
Hmong Daw mww
Erzya myv
Napolitano nap
Nepalês ne
Niueano niu
Holandês nl
Norueguês no
Nogai nog
Occitânico oc
Ossétio os
Panjabi pa
Polonês pl
Dari prs
Pushto ps
Português pt
K'iche' quc
Camling rab
Romanche rm
Romeno ro
Russo ru
Sânscrito sa
Santali sat
Linguagem Código (opcional)
Sadri sck
Escoceses sco
Eslovaco sk
Esloveno sl
Samoano sm
Sami do Sul sma
Sami do Norte sme
Lule Sami smj
Inari Sami smn
Skolt Sami sms
Somali so
Albanês sq
Sérvio (latino) sr, sr-latn
Sirmauri srx
Sueco sv
Suaíli sw
Tetum tet
Tadjique tg
Thangmi thf
Turcomeno tk
Tonga to
Turco tr
Tártaro tt
Tuviniano tyv
Uighur ug
Urdu ur
Uzbeque (latino) uz, uz-latn
Uzbeque (Cirílico) uz-cyrl
Uzbeque (árabe) uz-arab
Volapuque vo
Walser wae
Kangri xnr
Yucateco yua
Zhuang za
Chinês (Han (variante simplificada)) zh, zh-hans
Chinês (Han (variante tradicional)) zh-hant
Zulu zu

Layout

ID do modelo: layout predefinido

A tabela a seguir lista os idiomas com suporte para texto impresso:

Língua Código (opcional)
Abaza abq
Abecásia ab
Achinese ace
Acoli ach
Adangme ada
Adyghe ady
Longe aa
Africâner af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aimará ay
Azerbaijão (Latino) az
Bafia ksf
Bagheli bfy
Bambara bm
Bashkir ba
Basco eu
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (alfabeto latino) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (Latino) bs
Brajbha bra
Breton br
Búlgaro bg
Bundeli bns
Buryat (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chinês simplificado zh-Hans
Chinês tradicional zh-Hant
Choctaw cho
Chukot ckt
Chuvash cv
córnico kw
Córsico co
Cree cr
Creek mus
Tártaro Crimeano (Latim) crh
Croata hr
Corvo cro
Tcheco cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Holandês nl
Efik efi
Inglês en
Erzya (cirílico) myv
Estoniano et
Faroês fo
Fijiano fj
Filipinas fil
Finlandês fi
Linguagem Código (opcional)
Fon fon
Francês fr
Friulian fur
Ga gaa
Gagauz (Latim) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertês gil
Gondi (Devanagari) gon
Grego el
Groenlandês kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo Haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (latim) mww
Ho(Devanagiri) hoc
Húngaro hu
Iban iba
Islandês is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésio id
Ingush inh
Interlíngua ia
Inuktitut (latino) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardiano kbd
Kabuverdianu kea
Kachin (Latim) kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (cirílico) kaa-cyrl
Kara-Kalpak (latino) kaa
Kashubian csb
Cazaque (Cirílico) kk-cyrl
Cazaque (latino) kk-latn
Khakas kjh
Khaling klr
Khasi kha
K'iche' quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
Koryak kpy
Kosraano kos
Kpelle kpe
Kuanyama kj
Kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (Latim) ku-latn
Linguagem Código (opcional)
Kurukh (Devanagari) kru
Quirguistão (cirílico) ky
Lak lbe
Lakota lkt
Latina la
Letão lv
Lezghian lex
Lingala ln
Lituano lt
Sorbian inferior dsb
Lozi loz
Lule Sami smj
Luo (Quênia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedónio mk
Machame jmc
Madurese mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (latino) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marati mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) men
Meru mer
Meta' mgo
Minangkabau min
Mohawk moh
Mongol (cirílico) mn
Mongondow mog
Montenegrino (cirílico) cnr-cyrl
Montenegrino (latino) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitano nap
Nepalês ne
Ngomba jgo
Niueano niu
Nogay nog
North Ndebele nd
Sami do Norte (Latino) sme
Norueguês no
Nianja ny
Nyankole nyn
Nzima nzi
Occitânico oc
Ojibwa oj
Oromo om
Ossético os
Pampanga pam
Pangasinan pag
Papiamento pap
Pachto ps
Pedi nso
Persa fa
Polonês pl
Português pt
Punjabi (árabe) pa
Quíchua qu
Ripuário ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Linguagem Código (opcional)
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoano (alfabeto latino) sm
Sango sg
Sangu (Gabão) snq
Sânscrito (Devanagari) sa
Santali(Devanagiri) sat
Escoceses sco
Gaélico escocês gd
Sena seh
Sérvio (Cirílico) sr-cyrl
Sérvio (latino) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) so
Somali (Latim) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
Sami do Sul sma
Sotho do Sul st
Espanhol es
Sundanês su
Swahili (latim) sw
Swati ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tajique (cirílico) tg
Tâmil ta
Tatar (Cirílico) tt-cyrl
Tatar (latino) tt
Teso teo
Tetum tet
Tailandês th
Thangmi thf
Tok Pisin tpi
Tonga to
Tsonga ts
Tswana tn
Turco tr
Turcomeno (Latim) tk
Tuvan tyv
Udmurt udm
Uigure (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio hsb
Urdu ur
Uigure (árabe) ug
Uzbeque (árabe) uz-arab
Uzbeque (Cirílico) uz-cyrl
Uzbeque (latino) uz
Vietnamita vi
Volapuque vo
Vunjo vun
Walser wae
Galês cy
Frísia Ocidental fy
Wolof wo
Xhosa xh
Yucatec Maya yua
Zapoteca zap
Zarma dje
Zhuang za
Zulu zu

A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto impresso .

Língua Código (opcional)
Africâner af
Angika anp
Árabe ar
Asturiano ast
Awadhi awa
Azerbaijão az
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (alfabeto latino) be-latn
Bagheli bfy
Mahasu Pahari bfz
Búlgaro bg
Haryanvi bgc
Bhojpuri bho
Bislama bi
Bundeli bns
Breton br
Braj bra
Bodo brx
Bósnio bs
Buriat bua
Catalão ca
Cebuano ceb
Chamorro ch
Montenegrino (latino) cnr, cnr-latn
Montenegrino (cirílico) cnr-cyrl
Córsico co
Tártaro da Criméia crh
Tcheco cs
Kashubian csb
Galês cy
Dinamarquês da
Alemão de
Dhimal dhi
Dogri doi
Sorbian inferior dsb
Inglês en
Espanhol es
Estoniano et
Basco eu
Persa fa
Finlandês fi
Filipinas fil
Linguagem Código (opcional)
Fijiano fj
Faroês fo
Francês fr
Friulian fur
Frísia Ocidental fy
Irlandês ga
Gagauz gag
Gaélico escocês gd
Gilbertês gil
Galego gl
Gondi gon
Manx gv
Gurung gvr
Havaiano haw
Hindi hi
Halbi hlb
Chhattisgarhi hne
Hani hni
Ho hoc
Croata hr
Alto Sorábio hsb
Haitiano ht
Húngaro hu
Interlíngua ia
Indonésio id
Islandês is
Italiano it
Inuktitut iu
Japonês
Jaunsari jns
Javanês jv
Kara-Kalpak (latino) kaa, kaa-latn
Kara-Kalpak (cirílico) kaa-cyrl
Kachin kac
Kabuverdianu kea
Korku kfq
Khasi kha
Cazaque (latino) kk, kk-latn
Cazaque (Cirílico) kk-cyrl
Kalaallisut kl
Khaling klr
Malto kmj
Linguagem Código (opcional)
Coreano
Kosraano kos
Koryak kpy
Karachay-Balkar krc
Kurukh kru
Kölsch ksh
Curdo (Latim) ku, ku-latn
Curdo (árabe) ku-arab
Kumyk kum
córnico kw
Quirguiz ky
Latina la
Luxemburguês lb
Lakota lkt
Lituano lt
Maori mi
Mongol mn
Marati mr
Malaio ms
Maltês mt
Hmong Daw mww
Erzya myv
Napolitano nap
Nepalês ne
Niueano niu
Holandês nl
Norueguês no
Nogai nog
Occitânico oc
Ossétio os
Panjabi pa
Polonês pl
Dari prs
Pushto ps
Português pt
K'iche' quc
Camling rab
Romanche rm
Romeno ro
Russo ru
Sânscrito sa
Santali sat
Linguagem Código (opcional)
Sadri sck
Escoceses sco
Eslovaco sk
Esloveno sl
Samoano sm
Sami do Sul sma
Sami do Norte sme
Lule Sami smj
Inari Sami smn
Skolt Sami sms
Somali so
Albanês sq
Sérvio (latino) sr, sr-latn
Sirmauri srx
Sueco sv
Suaíli sw
Tetum tet
Tadjique tg
Thangmi thf
Turcomeno tk
Tonga to
Turco tr
Tártaro tt
Tuviniano tyv
Uighur ug
Urdu ur
Uzbeque (latino) uz, uz-latn
Uzbeque (Cirílico) uz-cyrl
Uzbeque (árabe) uz-arab
Volapuque vo
Walser wae
Kangri xnr
Yucateco yua
Zhuang za
Chinês (Han (variante simplificada)) zh, zh-hans
Chinês (Han (variante tradicional)) zh-hant
Zulu zu
Linguagem Código de idioma
Africâner af
Albanês sq
Asturiano ast
Basco eu
Bislama bi
Breton br
Catalão ca
Cebuano ceb
Chamorro ch
Chinês (simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
córnico kw
Córsico co
Tártaro da Crimeia (latim) crh
Tcheco cs
Dinamarquês da
Holandês nl
Inglês (impresso e manuscrito) en
Estoniano et
Fijiano fj
Filipinas fil
Finlandês fi
Francês fr
Friulian fur
Galego gl
Alemão de
Gilbertês gil
Groenlandês kl
Crioulo Haitiano ht
Hani hni
Hmong Daw (latim) mww
Húngaro hu
Indonésio id
Interlíngua ia
Inuktitut (latino) iu
Irlandês ga
Linguagem Código de idioma
Italiano it
Japonês ja
Javanês jv
K'iche' quc
Kabuverdianu kea
Kachin (Latim) kac
Kara-Kalpak kaa
Kashubian csb
Khasi kha
Coreano ko
Curdo (latim) kur
Luxemburguês lb
Malaio (latino) ms
Manx gv
Napolitano nap
Norueguês no
Occitânico oc
Polonês pl
Português pt
Romanche rm
Escoceses sco
Gaélico escocês gd
Esloveno slv
Espanhol es
Swahili (latim) sw
Sueco sv
Tatar (latin) tat
Tetum tet
Turco tr
Alto Sorábio hsb
Uzbeque (latino) uz
Volapuque vo
Walser wae
Frísia Ocidental fy
Yucatec Maya yua
Zhuang za
Zulu zu

Documento geral

Importante

Com o Document Intelligence v4.0:2024-11-30 (GA), o modelo geral de documento (prebuilt-document) está sendo integrado ao layout (prebuilt-layout). Para extrair pares chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, use os seguintes modelos:

Pares de valor de chave versão ID do modelo
Modelo de layout com string de consulta features=keyValuePairs especificada. • v4:2024-11-30 (GA)
• v3.1:2023-07-31 (GA)
prebuilt-layout
Modelo de documento geral • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
prebuilt-document
ID do modelo: documento predefinido

A tabela a seguir lista o suporte geral ao idioma do modelo de documento.

Modelo ID Idioma – Código de localidade Padrão
documento predefinido Inglês (Estados Unidos)— en-US Inglês (Estados Unidos)—en-US