Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Observação
O suporte para esta versão do Databricks Runtime terminou. Para a data de fim de suporte, consulte Fim de suporte e histórico de fim de vida útil. Para todas as versões suportadas do Databricks Runtime, consulte Versões e compatibilidade das notas de versão do Databricks Runtime.
Databricks Runtime 11.0 for Machine Learning fornece um ambiente pronto para uso para Machine Learning e ciência de dados baseado no Databricks Runtime 11.0 (EoS). O Databricks Runtime ML contém muitas bibliotecas populares de aprendizado de máquina, incluindo TensorFlow, PyTorch e XGBoost. O Databricks Runtime ML inclui o AutoML, uma ferramenta para treinar automaticamente pipelines de aprendizado de máquina. O Databricks Runtime ML também suporta treinamento distribuído de aprendizado profundo usando o Horovod.
Para obter mais informações, incluindo instruções para criar um cluster de ML do Databricks Runtime, consulte IA e aprendizado de máquina no Databricks.
Novos recursos e melhorias
O Databricks Runtime 11.0 ML é construído sobre o Databricks Runtime 11.0. Para obter informações sobre o que há de novo no Databricks Runtime 11.0, incluindo Apache Spark MLlib e SparkR, consulte as notas de versão do Databricks Runtime 11.0 (EoS ).
Melhorias no AutoML
O AutoML agora suporta frações de amostragem mais altas para um melhor desempenho em grandes conjuntos de dados. Para obter detalhes, consulte Amostragem de grandes conjuntos de dados.
Ambiente do sistema
O ambiente do sistema no Databricks Runtime 11.0 ML difere do Databricks Runtime 11.0 da seguinte forma:
-
DBUtils: o Databricks Runtime ML não inclui o utilitário de biblioteca (dbutils.library) (legado).
Em vez disso, use comandos
%pip. Ver Bibliotecas de Python com âmbito de notebook. - Para clusters de GPU, o Databricks Runtime ML inclui as seguintes bibliotecas de GPU NVIDIA:
- CUDA 11,3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
Bibliotecas
As seções a seguir listam as bibliotecas incluídas no Databricks Runtime 11.0 ML que diferem daquelas incluídas no Databricks Runtime 11.0.
Nesta secção:
- Bibliotecas de nível superior
- Python bibliotecas
- Bibliotecas R
- Bibliotecas Java e Scala (cluster Scala 2.12)
Bibliotecas de nível superior
O Databricks Runtime 11.0 ML inclui as seguintes bibliotecas de camada superior:
- GraphFrames
- Horovod e HorovodRunner
- MLflow
- PyTorch
- Spark-TensorFlow Connector
- TensorFlow
- TensorBoard
Bibliotecas Python
O Databricks Runtime 11.0 ML utiliza o Virtualenv para gestão de pacotes em Python e inclui muitos pacotes populares de ML.
Além dos pacotes especificados nas seções a seguir, o Databricks Runtime 11.0 ML também inclui os seguintes pacotes:
- hiperopt 0.2.7.db1
- SparkDL 2.2.0-DB6
- feature_store 0.4.1
- AutoML 1,10 |
Bibliotecas Python em clusters de CPU
| Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
|---|---|---|---|---|---|
| ABSL-PY | 1.0.0 | Antergos Linux | 2015.10 (ISO-Contínuo) | argon2-cffi | 20.1.0 |
| Astor | 0.8.1 | astunparse | 1.6.3 | gerador assíncrono | 1.10 |
| Atributos | 21.2.0 | Chamada de retorno | 0.2.0 | backports.pontos-de-entrada-selecionáveis | 1.1.1 |
| bcrypt | 3.2.2 | lixívia | 4.0.0 | felicidade | 0.7.7 |
| boto3 | 1.21.18 | Botocore | 1.24.18 | Ferramentas de cache | 5.1.0 |
| catálogo | 2.0.7 | certifi | 2021.10.8 | cffi | 1.14.6 |
| Chardet | 4.0.0 | Normalizador de Charset | 2.0.4 | clicar | 8.0.3 |
| Cloudpickle | 2.0.0 | cmdstanpy | 0.9.68 | configparser | 5.2.0 |
| convertdate | 2.4.0 | criptografia | 3.4.8 | ciclista | 0.10.0 |
| cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.8 |
| databricks-cli | 0.16.4 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | decorador | 5.1.0 | defusedxml | 0.7.1 |
| aneto | 0.3.4 | cache de disco | 5.4.0 | Distlib | 0.3.4 |
| distro-info | 0,23ubuntu1 | pontos de entrada | 0,3 | Ephem | 4.1.3 |
| facetas-visão geral | 1.0.0 | FastText | 0.9.2 | bloqueio de arquivo | 3.3.1 |
| Flask | 1.1.2 | flatbuffers | 2.0 | fsspec | 2021.8.1 |
| Futuro | 0.18.2 | gast | 0.5.3 | GitDB | 4.0.9 |
| GitPython | 3.1.27 | Google-Auth (Autenticação) | 2.6.0 | google-auth-oauthlib (biblioteca de autenticação OAuth do Google) | 0.4.6 |
| Google-Pasta | 0.2.0 | Grpcio | 1.44.0 | Gunicorn | 20.1.0 |
| GVIZ-API | 1.10.0 | H5PY | 3.3.0 | Conversor de Hijri | 2.2.3 |
| feriados | 0,13 | Horovod (dança tradicional russa) | 0.24.3 | htmlmin | 0.1.12 |
| Hugging Face Hub | 0.6.0 | IDNA | 3.2 | ImageHash | 4.2.1 |
| aprendizagem não balanceada | 0.8.1 | importlib-metadata | 4.8.1 | Ipykernel | 6.12.1 |
| IPython | 7.32.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 |
| isodate | 0.6.1 | é perigoso | 2.0.1 | Jedi | 0.18.0 |
| Jinja2 | 2.11.3 | jmespath | 0.10.0 | Joblib | 1.0.1 |
| Joblibspark | 0.5.0 | jsonschema | 3.2.0 | Jupyter Client | 6.1.12 |
| Jupyter-Core | 4.8.1 | Jupyterlab-Pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
| Keras | 2.8.0 | Pré-processamento de Keras | 1.1.2 | kiwisolver | 1.3.1 |
| calendário lunar coreano | 0.2.1 | códigos de idioma | 3.3.0 | libclang | 14.0.1 |
| LightGBM | 3.3.2 | llvmlite | 0.38.0 | LunarCalendário | 0.0.9 |
| Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
| Matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
| Mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.26.0 |
| multimétodo | 1.8 | Murmurhash | 1.0.7 | nbclient | 0.5.3 |
| nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
| networkx | 2.6.3 | NLTK | 3.6.5 | bloco de notas | 6.4.5 |
| numba | 0.55.1 | numpy | 1.20.3 | OAuthlib | 3.2.0 |
| opt-einsum | 3.3.0 | embalagem | 21.0 | pandas | 1.3.4 |
| pandas-profiling | 3.1.0 | PandocFilters | 1.4.3 | Paramiko | 2.9.2 |
| Parso | 0.8.2 | patia | 0.6.1 | vítima | 0.5.2 |
| petastorm | 0.11.4 | pexpect | 4.8.0 | Phik | 0.12.2 |
| pickleshare | 0.7.5 | Almofada | 8.4.0 | pip | 21.2.4 |
| platformdirs | 2.5.2 | enredo | 5.6.0 | pmdarima | 1.8.5 |
| Preshed | 3.0.6 | Prometheus-Cliente | 0.11.0 | kit de ferramentas de prompt | 3.0.20 |
| profeta | 1.0.1 | Protobuf | 3.19.4 | psutil | 5.8.0 |
| psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | Pyarrow | 7.0.0 |
| pyasn1 | 0.4.8 | pyasn1-módulos | 0.2.8 | pybind11 | 2.9.2 |
| Pycparser | 2,20 | Pidântico | 1.8.2 | Pigmentos | 2.10.0 |
| PyGObject | 3.36.0 | PyMeeus | 0.5.11 | PyNaCl | 1.5.0 |
| pyodbc | 4.0.31 | pyparsing | 3.0.4 | pyrsistent | 0.18.0 |
| Pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.7 | python-dateutil (uma biblioteca de software para manipulação de datas em Python) | 2.8.2 |
| editor de Python | 1.0.4 | Pytz | 2021.3 | PyWavelets | 1.1.1 |
| PyYAML | 6,0 | Pyzmq | 22.2.1 | regex | 2021.8.3 |
| pedidos | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
| RSA | 4.8 | s3transfer | 0.5.2 | sacremoses | 0.0.53 |
| scikit-learn (biblioteca de aprendizado de máquina em Python) | 0.24.2 | SciPy | 1.7.1 | nascido no mar | 0.11.2 |
| Send2Trash | 1.8.0 | Ferramentas de configuração | 58.0.4 | setuptools-git | 1.2 |
| forma | 0.40.0 | simplejson | 3.17.6 | seis | 1.16.0 |
| cortador | 0.0.7 | smart-open | 5.2.1 | smmap | 5.0.0 |
| espaçoso | 3.2.3 | Spacy-legado | 3.0.9 | spacy-loggers | 1.0.2 |
| spark-tensorflow-distributor | 1.0.0 | SQLPARSE | 0.4.2 | a sério? | 2.4.3 |
| ssh-import-id | 5.10 | statsmodels (uma biblioteca de Python para modelos estatísticos) | 0.12.2 | organizar em tabela | 0.8.9 |
| enredado em Unicode | 0.1.0 | tenacidade | 8.0.1 | TensorBoard | 2.8.0 |
| TensorBoard-Servidor de Dados | 0.6.1 | TensorBoard Plugin Profile | 2.5.0 | Tensorboard-plugin-wit | 1.8.1 |
| TensorFlow CPU | 2.8.0 | TensorFlow-Estimador | 2.8.0 | TensorFlow-IO-GCS-FileSystem | 0.25.0 |
| Termcolor | 1.1.0 | concluído | 0.9.4 | caminho de teste | 0.5.0 |
| TF-Estimador-Noturno | 2.8.0.dev2021122109 | Thinc | 8.0.15 | ThreadPoolCtl | 2.2.0 |
| Tokenizadores | 0.12.1 | tocha | 1.11.0+cpu | Torchvision | 0.12.0+CPU |
| tornado | 6.1 | tqdm | 4.62.3 | traitlets | 5.1.0 |
| transformadores | 4.17.0 | mecanógrafo | 0.4.1 | extensões de digitação | 3.10.0.2 |
| Ujson | 4.0.2 | Atualizações não supervisionadas | 0.1 | urllib3 | 1.26.7 |
| virtualenv | 20.8.0 | visões | 0.7.4 | Wasabi | 0.9.1 |
| wcwidth | 0.2.5 | codificações da web | 0.5.1 | Websocket-cliente | 1.3.1 |
| Werkzeug | 2.0.2 | wheel | 0.37.0 | widgetsnbextension | 3.6.0 |
| embrulhado | 1.12.1 | xgboost | 1.5.2 | zipp | 3.6.0 |
Bibliotecas Python em clusters de GPU
| Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
|---|---|---|---|---|---|
| ABSL-PY | 1.0.0 | Antergos Linux | 2015.10 (ISO-Contínuo) | argon2-cffi | 20.1.0 |
| Astor | 0.8.1 | astunparse | 1.6.3 | gerador assíncrono | 1.10 |
| Atributos | 21.2.0 | Chamada de retorno | 0.2.0 | backports.pontos-de-entrada-selecionáveis | 1.1.1 |
| bcrypt | 3.2.2 | lixívia | 4.0.0 | felicidade | 0.7.7 |
| boto3 | 1.21.18 | Botocore | 1.24.18 | Ferramentas de cache | 5.1.0 |
| catálogo | 2.0.7 | certifi | 2021.10.8 | cffi | 1.14.6 |
| Chardet | 4.0.0 | Normalizador de Charset | 2.0.4 | clicar | 8.0.3 |
| Cloudpickle | 2.0.0 | cmdstanpy | 0.9.68 | configparser | 5.2.0 |
| convertdate | 2.4.0 | criptografia | 3.4.8 | ciclista | 0.10.0 |
| cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.8 |
| databricks-cli | 0.16.4 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | decorador | 5.1.0 | defusedxml | 0.7.1 |
| aneto | 0.3.4 | cache de disco | 5.4.0 | Distlib | 0.3.4 |
| distro-info | 0,23ubuntu1 | pontos de entrada | 0,3 | Ephem | 4.1.3 |
| facetas-visão geral | 1.0.0 | FastText | 0.9.2 | bloqueio de arquivo | 3.3.1 |
| Flask | 1.1.2 | flatbuffers | 2.0 | fsspec | 2021.8.1 |
| Futuro | 0.18.2 | gast | 0.5.3 | GitDB | 4.0.9 |
| GitPython | 3.1.27 | Google-Auth (Autenticação) | 2.6.0 | google-auth-oauthlib (biblioteca de autenticação OAuth do Google) | 0.4.6 |
| Google-Pasta | 0.2.0 | Grpcio | 1.44.0 | Gunicorn | 20.1.0 |
| GVIZ-API | 1.10.0 | H5PY | 3.3.0 | Conversor de Hijri | 2.2.3 |
| feriados | 0,13 | Horovod (dança tradicional russa) | 0.24.3 | htmlmin | 0.1.12 |
| Hugging Face Hub | 0.6.0 | IDNA | 3.2 | ImageHash | 4.2.1 |
| aprendizagem não balanceada | 0.8.1 | importlib-metadata | 4.8.1 | Ipykernel | 6.12.1 |
| IPython | 7.32.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 |
| isodate | 0.6.1 | é perigoso | 2.0.1 | Jedi | 0.18.0 |
| Jinja2 | 2.11.3 | jmespath | 0.10.0 | Joblib | 1.0.1 |
| Joblibspark | 0.5.0 | jsonschema | 3.2.0 | Jupyter Client | 6.1.12 |
| Jupyter-Core | 4.8.1 | Jupyterlab-Pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
| Keras | 2.8.0 | Pré-processamento de Keras | 1.1.2 | kiwisolver | 1.3.1 |
| calendário lunar coreano | 0.2.1 | códigos de idioma | 3.3.0 | libclang | 14.0.1 |
| LightGBM | 3.3.2 | llvmlite | 0.38.0 | LunarCalendário | 0.0.9 |
| Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
| Matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
| Mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.26.0 |
| multimétodo | 1.8 | Murmurhash | 1.0.7 | nbclient | 0.5.3 |
| nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
| networkx | 2.6.3 | NLTK | 3.6.5 | bloco de notas | 6.4.5 |
| numba | 0.55.1 | numpy | 1.20.3 | OAuthlib | 3.2.0 |
| opt-einsum | 3.3.0 | embalagem | 21.0 | pandas | 1.3.4 |
| pandas-profiling | 3.1.0 | PandocFilters | 1.4.3 | Paramiko | 2.9.2 |
| Parso | 0.8.2 | patia | 0.6.1 | vítima | 0.5.2 |
| petastorm | 0.11.4 | pexpect | 4.8.0 | Phik | 0.12.2 |
| pickleshare | 0.7.5 | Almofada | 8.4.0 | pip | 21.2.4 |
| platformdirs | 2.5.2 | enredo | 5.6.0 | pmdarima | 1.8.5 |
| Preshed | 3.0.6 | kit de ferramentas de prompt | 3.0.20 | profeta | 1.0.1 |
| Protobuf | 3.19.4 | psutil | 5.8.0 | psycopg2 | 2.9.3 |
| ptyprocess | 0.7.0 | Pyarrow | 7.0.0 | pyasn1 | 0.4.8 |
| pyasn1-módulos | 0.2.8 | pybind11 | 2.9.2 | Pycparser | 2,20 |
| Pidântico | 1.8.2 | Pigmentos | 2.10.0 | PyGObject | 3.36.0 |
| PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
| pyparsing | 3.0.4 | pyrsistent | 0.18.0 | Pystan | 2.19.1.1 |
| python-apt | 2.0.0+ubuntu0.20.4.7 | python-dateutil (uma biblioteca de software para manipulação de datas em Python) | 2.8.2 | editor de Python | 1.0.4 |
| Pytz | 2021.3 | PyWavelets | 1.1.1 | PyYAML | 6,0 |
| Pyzmq | 22.2.1 | regex | 2021.8.3 | pedidos | 2.26.0 |
| requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 | RSA | 4.8 |
| s3transfer | 0.5.2 | sacremoses | 0.0.53 | scikit-learn (biblioteca de aprendizado de máquina em Python) | 0.24.2 |
| SciPy | 1.7.1 | nascido no mar | 0.11.2 | Send2Trash | 1.8.0 |
| Ferramentas de configuração | 58.0.4 | setuptools-git | 1.2 | forma | 0.40.0 |
| simplejson | 3.17.6 | seis | 1.16.0 | cortador | 0.0.7 |
| smart-open | 5.2.1 | smmap | 5.0.0 | espaçoso | 3.2.3 |
| Spacy-legado | 3.0.9 | spacy-loggers | 1.0.2 | spark-tensorflow-distributor | 1.0.0 |
| SQLPARSE | 0.4.2 | a sério? | 2.4.3 | ssh-import-id | 5.10 |
| statsmodels (uma biblioteca de Python para modelos estatísticos) | 0.12.2 | organizar em tabela | 0.8.9 | enredado em Unicode | 0.1.0 |
| tenacidade | 8.0.1 | TensorBoard | 2.8.0 | TensorBoard-Servidor de Dados | 0.6.1 |
| TensorBoard Plugin Profile | 2.5.0 | Tensorboard-plugin-wit | 1.8.1 | TensorFlow | 2.8.0 |
| TensorFlow-Estimador | 2.8.0 | TensorFlow-IO-GCS-FileSystem | 0.25.0 | Termcolor | 1.1.0 |
| concluído | 0.9.4 | caminho de teste | 0.5.0 | TF-Estimador-Noturno | 2.8.0.dev2021122109 |
| Thinc | 8.0.15 | ThreadPoolCtl | 2.2.0 | Tokenizadores | 0.12.1 |
| tocha | 1.11.0+cu113 | Torchvision | 0.12.0+cu113 | tornado | 6.1 |
| tqdm | 4.62.3 | traitlets | 5.1.0 | transformadores | 4.17.0 |
| mecanógrafo | 0.4.1 | extensões de digitação | 3.10.0.2 | Ujson | 4.0.2 |
| Atualizações não supervisionadas | 0.1 | urllib3 | 1.26.7 | virtualenv | 20.8.0 |
| visões | 0.7.4 | Wasabi | 0.9.1 | wcwidth | 0.2.5 |
| codificações da web | 0.5.1 | Websocket-cliente | 1.3.1 | Werkzeug | 2.0.2 |
| wheel | 0.37.0 | widgetsnbextension | 3.6.0 | embrulhado | 1.12.1 |
| xgboost | 1.5.2 | zipp | 3.6.0 |
Pacotes Spark contendo módulos Python
| Pacote Spark | Módulo Python | Versão |
|---|---|---|
| GraphFrames | GraphFrames | 0.8.2-db1-spark3.2 |
Bibliotecas R
As bibliotecas R são idênticas às bibliotecas R no Databricks Runtime 11.0.
Bibliotecas Java e Scala (cluster Scala 2.12)
Para além das bibliotecas Java e Scala no Databricks Runtime 11.0, o Databricks Runtime 11.0 ML contém os seguintes JARs:
Clusters de CPU
| ID do grupo | ID do artefato | Versão |
|---|---|---|
| com.typesafe.akka | akka-actor_2,12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.18.1-23eb1ef |
| ml.dmlc | xgboost4j-spark_2,12 | 1.5.2 |
| ml.dmlc | xgboost4j_2.12 | 1.5.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow cliente | 1.26.0 |
| org.mlflow | MLFLOW-Spark | 1.26.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 (conector de Spark para TensorFlow versão 2.12) | 1.15.0 |
Clusters de GPU
| ID do grupo | ID do artefato | Versão |
|---|---|---|
| com.typesafe.akka | akka-actor_2,12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.18.1-23eb1ef |
| ml.dmlc | xgboost4j-spark_2,12 | 1.5.2 |
| ml.dmlc | xgboost4j_2.12 | 1.5.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow cliente | 1.26.0 |
| org.mlflow | MLFLOW-Spark | 1.26.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 (conector de Spark para TensorFlow versão 2.12) | 1.15.0 |