Suporte linguístico: análise documental

Este conteúdo aplica-se a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (em retirada)red-checkmarkv2.1 (em retirada)

Este conteúdo aplica-se a:marca de verificaçãov3.1 (GA) | Última versão:marca de verificação roxav4.0 (GA) | Versões anteriores:marca de verificação azulv3.0marca de verificação azulv2.1

Este conteúdo aplica-se a:red-checkmarkv3.0 (em descontinuação) | Últimas versões:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versão anterior:blue-checkmarkv2.1 (em descontinuação)

Este conteúdo aplica-se a:red-checkmarkv2.1 | Última versão:blue-checkmarkv4.0 (GA)

O Azure Document Intelligence nos modelos Foundry Tools oferece suporte para processamento de documentos multilíngue. As nossas capacidades de suporte linguístico permitem aos seus utilizadores comunicar com as suas aplicações de forma natural e potenciar o alcance global. Os modelos de análise documental permitem a extração de texto de formulários e documentos e devolvem conteúdos estruturados prontos para negócios, prontos para a ação, utilização ou progresso da sua organização. As tabelas seguintes listam o suporte de línguas e localidades disponíveis por modelo e funcionalidade:

  • Ler: O modelo de leitura permite a extração e análise de texto impresso e manuscrito. Este modelo é o motor de OCR subjacente para outros modelos pré-construídos de Inteligência Documental, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para mais informações, consulteLer visão geral do modelo
  • Layout: O modelo de layout permite a extração e análise de texto, tabelas, estrutura do documento e marcas de seleção (como botões de acesso e caixas de seleção) a partir de formulários e documentos.

Nota

Código linguístico opcional

  • Os modelos universais baseados em deep learning da Document Intelligence extraem todo o texto multilíngue dos seus documentos, incluindo linhas de texto com línguas mistas, e não exigem especificar um código linguístico.

  • Não forneça o código da linguagem como parâmetro a menos que tenha a certeza da linguagem e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode devolver texto incompleto e incorreto.

  • Além disso, não é necessário especificar um local. Este é um parâmetro opcional. A tecnologia de deep learning Document Intelligence irá detetar automaticamente a linguagem do texto na sua imagem.

Modelo de leitura

ID do modelo: leitura pré-configurada

A tabela seguinte lista o suporte de linguagem do modelo de leitura para extrair e analisar texto impresso.

Linguagem Código (opcional)
Abaza abq
Abkhazo ab
Chinês ace
Acoli ach
Adangme ada
Adyghe ady
Afar aa
Africâner af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aymara ay
Azeri (latim) az
Bafia ksf
Bagheli bfy
Bambara bm
Bashkir ba
Basco eu
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (latim) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (latim) bs
Brajbha bra
Bretão br
Búlgaro bg
Bundeli bns
Buriate (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chinês Simplificado zh-Hans
Chinês Tradicional zh-Hant
Choctaw cho
Chukot ckt
Chuvash cv
Cornish kw
Corso co
Cree cr
Ribeira mus
Tártaro da Crimeia (latim) crh
Croata hr
Corvo cro
Checo cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Holandês nl
Efik efi
Inglês en
Erzya (cirílico) myv
Estónio et
Faroês fo
Fijiano fj
Filipino fil
Finlandês fi
Linguagem Código (opcional)
Fon fon
Francês fr
Friulano fur
Ga gaa
Gagauz (latim) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertês gil
Gondi (Devanagari) gon
Grego el
Gronelandês kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo Haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (latim) mww
Ho (Devanagiri) hoc
Húngaro hu
Iban iba
Islandês is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésio id
Inguche inh
Interlíngua ia
Inuktitut (Latin) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardiano kbd
Kabuverdianu kea
Kachin (latim) kac
Kalenjin kln
Calmuque xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (Cirílico) kaa-cyrl
Kara-Kalpak (Latim) kaa
Caxubiano csb
Cazaque (cirílico) kk-cyrl
Cazaque (latim) kk-latn
Khakas kjh
Khaling klr
Khasi kha
K'iche' quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
Koryak kpy
Kosraean kos
Kpelle kpe
Kuanyama kj
Kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (latim) ku-latn
Kurukh (Devanagari) kru
Quirguiz (cirílico) ky
Lak lbe
Lakota lkt
Linguagem Código (opcional)
Latim la
Letão lv
Lezghiano lex
Lingala ln
Lituano lt
Baixo Sorábio dsb
Lozi loz
Lule Sami smj
Luo (Quénia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedónio mk
Machame jmc
Madurês mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (latim) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marathi mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) men
Meru mer
Meta' mgo
Minangkabau min
Mohawk moh
Mongol (cirílico) mn
Mongondow mog
Montenegrino (cirílico) cnr-cyrl
Montenegrino (Latim) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitano nap
Nepali ne
Ngomba jgo
Niueano niu
Nogay nog
Ndebele do Norte nd
Sami do Norte (latim) sme
Norueguês no
Nyanja ny
Nyankole nyn
Nzima nzi
Occitano oc
Ojibwa oj
Oromo om
Ossética os
Pampanga pam
Pangasinan pag
Papiamento pap
Pashto ps
Pedi nso
Persa fa
Polaco pl
Português pt
Punjabi (árabe) pa
Quéchua qu
Ripuariano ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoa (latim) sm
Sango sg
Linguagem Código (opcional)
Sangu (Gabão) snq
Sânscrito (Devanagari) sa
Santali (Devanagiri) sat
Escoceses sco
Gaélico Escocês gd
Sena seh
Sérvio (cirílico) sr-cyrl
Sérvio (latim) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) so
Somali (latim) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
Sami do Sul sma
Sotho do Sul st
Espanhol es
Sundanês su
Suaíli (latim) sw
Swati ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tajique (cirílico) tg
Tamil ta
Tártaro (Cirílico) tt-cyrl
Tatar (Latim) tt
Teso teo
Tetum tet
Tailandês th
Thangmi thf
Tok Pisin tpi
Tonganês to
Tsonga ts
Tswana tn
Turco tr
Turcomeno (Latim) tk
Tuvan tyv
Udmurt udm
Uigur (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio hsb
Urdu ur
Uigur (árabe) ug
Uzbeque (árabe) uz-arab
Uzbeque (cirílico) uz-cyrl
Uzbeque (latim) uz
Vietnamita vi
Volapük vo
Vunjo vun
Walser wae
Galês cy
Frísia Ocidental fy
Wolof wo
Xhosa xh
Maia Yucateco yua
Zapotec zap
Zarma dje
Zhuang za
Zulu zu

A tabela seguinte lista o suporte de linguagem do modelo de leitura para extrair e analisar texto impresso.

Linguagem Código (opcional)
Africâner af
Angika anp
Árabe ar
Asturiano ast
Awadhi awa
Azerbaijano az
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (latim) be-latn
Bagheli bfy
Mahasu Pahari bfz
Búlgaro bg
Haryanvi bgc
Bhojpuri bho
Bislama bi
Bundeli bns
Bretão br
Braj bra
Bodo brx
Bósnia bs
Buriate bua
Catalão ca
Cebuano ceb
Chamorro ch
Montenegrino (Latim) cnr, cnr-latn
Montenegrino (cirílico) cnr-cyrl
Corso co
Tártaros da Crimeia crh
Checo cs
Caxubiano csb
Galês cy
Dinamarquês da
Alemão de
Dhimal dhi
Dogri doi
Baixo Sorábio dsb
Inglês en
Espanhol es
Estónio et
Basco eu
Persa fa
Finlandês fi
Filipino fil
Linguagem Código (opcional)
Fijiano fj
Faroês fo
Francês fr
Friulano fur
Frísia Ocidental fy
Irlandês ga
Gagauz gag
Gaélico Escocês gd
Gilbertês gil
Galego gl
Gondi gon
Manx gv
Gurung gvr
Havaiano haw
Hindi hi
Halbi hlb
Chhattisgarhi hne
Hani hni
Ho hoc
Croata hr
Alto Sorábio hsb
Haitiano ht
Húngaro hu
Interlíngua ia
Indonésio id
Islandês is
Italiano it
Inuktitut iu
Japonês
Jaunsari jns
Javanês jv
Kara-Kalpak (Latim) kaa, kaa-latn
Kara-Kalpak (Cirílico) kaa-cyrl
Kachin kac
Kabuverdianu kea
Korku kfq
Khasi kha
Cazaque (latim) kk, kk-latn
Cazaque (cirílico) kk-cyrl
Kalaallisut kl
Khaling klr
Malto kmj
Linguagem Código (opcional)
Coreano
Kosraean kos
Koryak kpy
Karachay-Balkar krc
Kurukh kru
Kölsch ksh
Curdo (latim) ku, ku-latn
Curdo (árabe) ku-arab
Kumyk kum
Cornish kw
Quirguiz ky
Latim la
Luxemburguês lb
Lakota lkt
Lituano lt
Maori mi
Mongol mn
Marathi mr
Malaio ms
Maltês mt
Hmong Daw mww
Erzya myv
Napolitano nap
Nepali ne
Niueano niu
Holandês nl
Norueguês no
Nogai nog
Occitano oc
Ossétio os
Panjabi pa
Polaco pl
Dari prs
Pachto ps
Português pt
K'iche' quc
Camling rab
Romanche rm
Romeno ro
Russo ru
Sânscrito sa
Santali sat
Linguagem Código (opcional)
Sadri sck
Escoceses sco
Eslovaco sk
Esloveno sl
Samoa sm
Sami do Sul sma
Sami do Norte sme
Lule Sami smj
Inari Sami smn
Skolt Sami sms
Somali so
Albanês sq
Sérvio (latim) sr, sr-latn
Sirmauri srx
Sueco sv
Suaíli sw
Tetum tet
Tajique tg
Thangmi thf
Turcomanos tk
Tonga to
Turco tr
Tártaro tt
Tuviniano tyv
Uigur ug
Urdu ur
Uzbeque (latim) uz, uz-latn
Uzbeque (cirílico) uz-cyrl
Uzbeque (árabe) uz-arab
Volapük vo
Walser wae
Kangri xnr
Yucateco yua
Zhuang za
Chinês (Han (variante simplificada)) zh, zh-hans
Chinês (Han (variante tradicional)) zh-hant
Zulu zu

Disposição

ID do modelo: layout pré-definido

A tabela seguinte lista as línguas suportadas para texto impresso:

Língua Código (opcional)
Abaza abq
Abkhazo ab
Chinês ace
Acoli ach
Adangme ada
Adyghe ady
Afar aa
Africâner af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aymara ay
Azeri (latim) az
Bafia ksf
Bagheli bfy
Bambara bm
Bashkir ba
Basco eu
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (latim) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (latim) bs
Brajbha bra
Bretão br
Búlgaro bg
Bundeli bns
Buriate (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chinês Simplificado zh-Hans
Chinês Tradicional zh-Hant
Choctaw cho
Chukot ckt
Chuvash cv
Cornish kw
Corso co
Cree cr
Ribeira mus
Tártaro da Crimeia (latim) crh
Croata hr
Corvo cro
Checo cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Holandês nl
Efik efi
Inglês en
Erzya (cirílico) myv
Estónio et
Faroês fo
Fijiano fj
Filipino fil
Finlandês fi
Linguagem Código (opcional)
Fon fon
Francês fr
Friulano fur
Ga gaa
Gagauz (latim) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertês gil
Gondi (Devanagari) gon
Grego el
Gronelandês kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo Haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (latim) mww
Ho (Devanagiri) hoc
Húngaro hu
Iban iba
Islandês is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésio id
Inguche inh
Interlíngua ia
Inuktitut (Latin) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardiano kbd
Kabuverdianu kea
Kachin (latim) kac
Kalenjin kln
Calmuque xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (Cirílico) kaa-cyrl
Kara-Kalpak (Latim) kaa
Caxubiano csb
Cazaque (cirílico) kk-cyrl
Cazaque (latim) kk-latn
Khakas kjh
Khaling klr
Khasi kha
K'iche' quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
Koryak kpy
Kosraean kos
Kpelle kpe
Kuanyama kj
Kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (latim) ku-latn
Linguagem Código (opcional)
Kurukh (Devanagari) kru
Quirguiz (cirílico) ky
Lak lbe
Lakota lkt
Latim la
Letão lv
Lezghiano lex
Lingala ln
Lituano lt
Baixo Sorábio dsb
Lozi loz
Lule Sami smj
Luo (Quénia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedónio mk
Machame jmc
Madurês mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (latim) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marathi mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) men
Meru mer
Meta' mgo
Minangkabau min
Mohawk moh
Mongol (cirílico) mn
Mongondow mog
Montenegrino (cirílico) cnr-cyrl
Montenegrino (Latim) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitano nap
Nepali ne
Ngomba jgo
Niueano niu
Nogay nog
Ndebele do Norte nd
Sami do Norte (latim) sme
Norueguês no
Nyanja ny
Nyankole nyn
Nzima nzi
Occitano oc
Ojibwa oj
Oromo om
Ossética os
Pampanga pam
Pangasinan pag
Papiamento pap
Pashto ps
Pedi nso
Persa fa
Polaco pl
Português pt
Punjabi (árabe) pa
Quéchua qu
Ripuariano ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Linguagem Código (opcional)
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoa (latim) sm
Sango sg
Sangu (Gabão) snq
Sânscrito (Devanagari) sa
Santali (Devanagiri) sat
Escoceses sco
Gaélico Escocês gd
Sena seh
Sérvio (cirílico) sr-cyrl
Sérvio (latim) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) so
Somali (latim) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
Sami do Sul sma
Sotho do Sul st
Espanhol es
Sundanês su
Suaíli (latim) sw
Swati ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tajique (cirílico) tg
Tamil ta
Tártaro (Cirílico) tt-cyrl
Tatar (Latim) tt
Teso teo
Tetum tet
Tailandês th
Thangmi thf
Tok Pisin tpi
Tonganês to
Tsonga ts
Tswana tn
Turco tr
Turcomeno (Latim) tk
Tuvan tyv
Udmurt udm
Uigur (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio hsb
Urdu ur
Uigur (árabe) ug
Uzbeque (árabe) uz-arab
Uzbeque (cirílico) uz-cyrl
Uzbeque (latim) uz
Vietnamita vi
Volapük vo
Vunjo vun
Walser wae
Galês cy
Frísia Ocidental fy
Wolof wo
Xhosa xh
Maia Yucateco yua
Zapotec zap
Zarma dje
Zhuang za
Zulu zu

A tabela seguinte lista o suporte à linguagem de modelos de layout para extração e análise de texto impresso .

Língua Código (opcional)
Africâner af
Angika anp
Árabe ar
Asturiano ast
Awadhi awa
Azerbaijano az
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (latim) be-latn
Bagheli bfy
Mahasu Pahari bfz
Búlgaro bg
Haryanvi bgc
Bhojpuri bho
Bislama bi
Bundeli bns
Bretão br
Braj bra
Bodo brx
Bósnia bs
Buriate bua
Catalão ca
Cebuano ceb
Chamorro ch
Montenegrino (Latim) cnr, cnr-latn
Montenegrino (cirílico) cnr-cyrl
Corso co
Tártaros da Crimeia crh
Checo cs
Caxubiano csb
Galês cy
Dinamarquês da
Alemão de
Dhimal dhi
Dogri doi
Baixo Sorábio dsb
Inglês en
Espanhol es
Estónio et
Basco eu
Persa fa
Finlandês fi
Filipino fil
Linguagem Código (opcional)
Fijiano fj
Faroês fo
Francês fr
Friulano fur
Frísia Ocidental fy
Irlandês ga
Gagauz gag
Gaélico Escocês gd
Gilbertês gil
Galego gl
Gondi gon
Manx gv
Gurung gvr
Havaiano haw
Hindi hi
Halbi hlb
Chhattisgarhi hne
Hani hni
Ho hoc
Croata hr
Alto Sorábio hsb
Haitiano ht
Húngaro hu
Interlíngua ia
Indonésio id
Islandês is
Italiano it
Inuktitut iu
Japonês
Jaunsari jns
Javanês jv
Kara-Kalpak (Latim) kaa, kaa-latn
Kara-Kalpak (Cirílico) kaa-cyrl
Kachin kac
Kabuverdianu kea
Korku kfq
Khasi kha
Cazaque (latim) kk, kk-latn
Cazaque (cirílico) kk-cyrl
Kalaallisut kl
Khaling klr
Malto kmj
Linguagem Código (opcional)
Coreano
Kosraean kos
Koryak kpy
Karachay-Balkar krc
Kurukh kru
Kölsch ksh
Curdo (latim) ku, ku-latn
Curdo (árabe) ku-arab
Kumyk kum
Cornish kw
Quirguiz ky
Latim la
Luxemburguês lb
Lakota lkt
Lituano lt
Maori mi
Mongol mn
Marathi mr
Malaio ms
Maltês mt
Hmong Daw mww
Erzya myv
Napolitano nap
Nepali ne
Niueano niu
Holandês nl
Norueguês no
Nogai nog
Occitano oc
Ossétio os
Panjabi pa
Polaco pl
Dari prs
Pachto ps
Português pt
K'iche' quc
Camling rab
Romanche rm
Romeno ro
Russo ru
Sânscrito sa
Santali sat
Linguagem Código (opcional)
Sadri sck
Escoceses sco
Eslovaco sk
Esloveno sl
Samoa sm
Sami do Sul sma
Sami do Norte sme
Lule Sami smj
Inari Sami smn
Skolt Sami sms
Somali so
Albanês sq
Sérvio (latim) sr, sr-latn
Sirmauri srx
Sueco sv
Suaíli sw
Tetum tet
Tajique tg
Thangmi thf
Turcomanos tk
Tonga to
Turco tr
Tártaro tt
Tuviniano tyv
Uigur ug
Urdu ur
Uzbeque (latim) uz, uz-latn
Uzbeque (cirílico) uz-cyrl
Uzbeque (árabe) uz-arab
Volapük vo
Walser wae
Kangri xnr
Yucateco yua
Zhuang za
Chinês (Han (variante simplificada)) zh, zh-hans
Chinês (Han (variante tradicional)) zh-hant
Zulu zu
Linguagem Código da língua
Africâner af
Albanês sq
Asturiano ast
Basco eu
Bislama bi
Bretão br
Catalão ca
Cebuano ceb
Chamorro ch
Chinês (Simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
Cornish kw
Corso co
Tártaro da Crimeia (latim) crh
Checo cs
Dinamarquês da
Holandês nl
Inglês (impresso e manuscrito) en
Estónio et
Fijiano fj
Filipino fil
Finlandês fi
Francês fr
Friulano fur
Galego gl
Alemão de
Gilbertês gil
Gronelandês kl
Crioulo Haitiano ht
Hani hni
Hmong Daw (latim) mww
Húngaro hu
Indonésio id
Interlíngua ia
Inuktitut (Latin) iu
Irlandês ga
Linguagem Código da língua
Italiano it
Japonês ja
Javanês jv
K'iche' quc
Kabuverdianu kea
Kachin (latim) kac
Kara-Kalpak kaa
Caxubiano csb
Khasi kha
Coreano ko
Curdo (latim) kur
Luxemburguês lb
Malaio (latim) ms
Manx gv
Napolitano nap
Norueguês no
Occitano oc
Polaco pl
Português pt
Romanche rm
Escoceses sco
Gaélico Escocês gd
Esloveno slv
Espanhol es
Suaíli (latim) sw
Sueco sv
Tatar (Latim) tat
Tetum tet
Turco tr
Alto Sorábio hsb
Uzbeque (latim) uz
Volapük vo
Walser wae
Frísia Ocidental fy
Maia Yucateco yua
Zhuang za
Zulu zu

Documento geral

Importante

Com o Document Intelligence v4.0:2024-11-30 (GA), o modelo geral de documento (documento pré-definido) está a ser adicionado ao layout (layout pré-definido). Para extrair pares-chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, utilize os seguintes modelos:

Pares-chave-valor versão ID do modelo
Modelo de layout com a string features=keyValuePairs de consulta especificada. • v4:2024-11-30 (GA)
• v3.1:2023-07-31 (GA)
prebuilt-layout
Modelo geral de documentos • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
prebuilt-document
ID do modelo: documento pré-construído

A tabela seguinte lista o suporte geral para linguagens de modelos de documentos.

Modelo ID Língua — Código local Padrão
documento pré-construído Inglês (EUA)—en-US Inglês (Estados Unidos)—en-US