Freigeben über


Databricks Runtime 12.2 LTS for Machine Learning (EoS)

Hinweis

Die Unterstützung für diese Databricks-Runtime-Version wurde beendet. Informationen zum Enddatum des Supports finden Sie unter "Ende des Supports" und "Ende des Lebenszyklus". Eine Übersicht aller unterstützten Databricks Runtime-Versionen finden Sie unter Versionshinweise und Kompatibilität von Databricks Runtime.

Databricks Runtime 12.2 LTS for Machine Learning bietet eine ready-to-go Umgebung für maschinelles Lernen und Data Science basierend auf Databricks Runtime 12.2 LTS (EoS). Databricks Runtime ML enthält viele beliebte Machine Learning-Bibliotheken, einschließlich TensorFlow, PyTorch und XGBoost. Databricks Runtime ML enthält AutoML, ein Tool zum automatischen Trainieren von Machine Learning-Pipelines. Databricks Runtime ML unterstützt auch verteiltes Deep Learning-Training mit Horovod.

Neue Features und Verbesserungen

Databricks Runtime 12.2 LTS ML basiert auf Databricks Runtime 12.2 LTS. Informationen zu den Neuerungen in Databricks Runtime 12.2 LTS, einschließlich Apache Spark MLlib und SparkR, finden Sie in den Versionshinweisen zu Databricks Runtime 12.2 LTS (EoS).

Automatisiertes maschinelles Lernen (AutoML)

Sie können vorhandene Featuretabellen im Feature-Store verwenden, um das ursprüngliche Eingabedataset für Vorhersageprobleme beim automatisierten ML zu erweitern. Ausführliche Informationen finden Sie unter AutoML Feature Store-Integration.

Weitere Informationen zu AutoML finden Sie unter Was ist AutoML?.

Systemumgebung

Die Systemumgebung in Databricks Runtime 12.2 LTS ML unterscheidet sich wie folgt von Databricks Runtime 12.2 LTS:

Databricks Runtime 12.2 LTS ML enthält XGBoost 1.7.2, das keine GPU-Cluster mit Computefunktionalität 5.2 und niedriger unterstützt.

Bibliotheken

In den folgenden Abschnitten sind die Bibliotheken aufgeführt, die in Databricks Runtime 12.2 LTS ML enthalten sind und sich von den in Databricks Runtime 12.2 LTS enthaltenen Bibliotheken unterscheiden.

Inhalt dieses Abschnitts:

Bibliotheken der obersten Ebene

Databricks Runtime 12.2 LTS ML enthält die folgenden Bibliotheken der obersten Ebene:

Python-Bibliotheken

Databricks Runtime 12.2 LTS ML verwendet Virtualenv zur Verwaltung von Python-Paketen und enthält viele beliebte ML-Pakete.

Zusätzlich zu den Paketen, die in den folgenden Abschnitten aufgeführt sind, umfasst Databricks Runtime 12.2 LTS ML auch die folgenden Pakete:

  • hyperopt 0.2.7+db3
  • sparkdl 2.3.0-db3
  • automl 1.16.0

Um die Databricks Runtime ML Python-Umgebung in Ihrer lokalen virtuellen Python-Umgebung zu reproduzieren, müssen Sie die Datei requirements-12.2.txt herunterladen und pip install -r requirements-12.2.txt ausführen. Dieser Befehl installiert alle Open Source-Bibliotheken, die von Databricks Runtime ML verwendet werden, installiert jedoch keine Bibliotheken, die von Databricks entwickelt wurden, wie zum Beispiel databricks-automl, databricks-feature-store oder die Databricks-Fork von hyperopt.

Python-Bibliotheken in CPU-Clustern

Bibliothek Version Bibliothek Version Bibliothek Version
absl-py 1.0.0 argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0
Astor 0.8.1 asttokens 2.0.5 astunparse 1.6.3
Attrs 21.4.0 Azure Core 1.26.3 Azure-Cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.2.0 bcrypt 3.2.0
beautifulsoup4 4.11.1 schwarz 22.3.0 Bleichmittel 4.1.0
blis 0.7.9 boto3 1.21.32 Botocore 1.24.32
CacheWerkzeuge 4.2.2 Katalog 2.0.8 Kategorie-Kodierer 2.5.1.post0
Zertifikat 2021.10.8 cffi 1.15.0 Chardet 4.0.0
Charset-Normalizer 2.0.4 klicken 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.1.0 Konfekt 0.0.4 configparser 5.2.0
Convertdate 2.4.0 Kryptographie 3.4.8 Fahrradfahrer 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.15
databricks-cli 0.17.4 databricks-feature-store 0.10.0 dbl-tempo 0.1.12
dbus-python 1.2.16 debugpy 1.5.1 Dekorateur 5.1.1
defusedxml 0.7.1 Dill 0.3.4 Festplatten-Cache 5.4.0
Distlib 0.3.6 Docstring zu Markdown 0.11 Einstiegspunkte 0,4
Kurzlebig 4.1.4 ausführen 0.8.3 Übersicht der Facetten 1.0.0
fastjsonschema 2.16.2 fasttext 0.9.2 Dateisperrung 3.6.0
Flask 1.1.2 FlatBuffers 23.1.21 fonttools 4.25.0
fsspec 2022.2.0 Zukunft 0.18.2 gast 0.4.0
gitdb 4.0.10 GitPython 3.1.27 google-auth 1.33.0
google-auth-oauthlib 0.4.6 Google-Pasta 0.2.0 GRPCIO 1.42.0
gunicorn 20.1.0 gviz-api 1.10.0 h5py 3.6.0
Hijri-Konverter 2.2.4 Ferien 0.18 horovod 0.27.0
htmlmin 0.1.12 huggingface-hub 0.12.0 IDNA 3.3
ImageHash 4.3.1 Ungleichgewichte lernen 0.10.1 importlib-metadata 4.11.3
ipykernel 6.15.3 ipython 8.5.0 ipython-genutils 0.2.0
ipywidgets 7.7.2 isodate 0.6.1 es ist gefährlich 2.0.1
Jedi 0.18.1 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.1.1 joblibspark 0.5.1 jsonschema 4.4.0
Jupyter-Client 6.1.12 jupyter_core 4.11.2 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.0 Keras 2.11.0 kiwisolver 1.3.2
koreanischer Lunarkalender 0.3.1 langcodes 3.3.0 libclang 15.0.6.1
lightgbm 3.3.4 llvmlite 0.38.0 Mondkalender 0.0.9
Mako 1.2.0 Markdown 3.3.4 MarkupSafe 2.0.1
matplotlib 3.5.1 matplotlib-inline 0.1.2 mccabe 0.7.0
mistune 0.8.4 mleap 0.20.0 mlflow-skinny 2.1.1
multimethod 1.9.1 Murmurhash 1.0.9 mypy-Erweiterungen 0.4.3
nbclient 0.5.13 nbconvert 6.4.4 nbformat 5.3.0
nest-asyncio 1.5.5 networkx 2.7.1 Natural Language Toolkit (nltk) 3.7
nodeenv 1.7.0 Notebook 6.4.8 numba 0.55.1
numpy 1.21.5 oauthlib 3.2.0 opt-einsum 3.3.0
Verpackung 21,3 Pandas 1.4.2 Pandas-Profiling 3.6.2
Pandocfilter 1.5.0 paramiko 2.9.2 Parso 0.8.3
pathspec 0.9.0 pathie 0.10.1 patsy 0.5.2
Petastorm 0.12.1 pexpect 4.8.0 phik 0.12.3
pickleshare 0.7.5 Kissen 9.0.1 pip 21.2.4
platformdirs 2.6.2 plotly 5.6.0 plugin-fähig 1.0.0
pmdarima 2.0.2 vorgehäckselt 3.0.8 prometheus-client 0.13.1
Prompt-Toolkit 3.0.20 prophet 1.1.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pure-eval 0.2.2 Pyarrow 7.0.0 Pyasn1 0.4.8
Pyasn1-Module 0.2.8 pybind11 2.10.3 Pycparser 2.21
Pydantisch 1.10.2 Pyflakes 2.5.0 Pygments 2.11.2
PyGObject 3.36.0 PyJWT 2.6.0 PyMeeus 0.5.12
PyNaCl 1.5.0 Pyodbc 4.0.32 Pyparsing 3.0.4
pyright 1.1.283 pyrsistent 0.18.0 Python-dateutil 2.8.2
python-editor 1.0.4 python-lsp-jsonrpc 1.0.0 Python-LSP-Server 1.6.0
Pytz 2021.3 PyWavelets 1.3.0 PyYAML 6,0
pyzmq 22.3.0 Regex 2022.3.15 requests 2.27.1
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 Seil 0.22.0
rsa 4.7.2 s3transfer 0.5.0 scikit-learn 1.0.2
SciPy 1.7.3 Seegeboren 0.11.2 Send2Trash 1.8.0
setuptools 61.2.0 setuptools-git 1.2 Schattierung 0.41.0
simplejson 3.17.6 Sechs 1.16.0 slicer 0.0.7
smart-open 5.2.1 smmap 5.0.0 Sieb für Suppe 2.3.1
Geräumig 3.4.4 spacy-legacy 3.0.12 spacy-loggers 1.0.4
Spark-Tensorflow-Distributor 1.0.0 sqlparse 0.4.2 srsly 2.4.5
ssh-import-id 5.10 Stapeldaten 0.2.0 StatistikModelle 0.13.2
tabellarisieren 0.8.9 tangled-up-in-unicode 0.2.0 Hartnäckigkeit 8.0.1
TensorBoard 2.11.2 tensorboard-data-server 0.6.1 tensorboard-plugin-profile (Tensorboard-Plugin-Profil) 2.11.1
tensorboard-plugin-wit 1.8.1 tensorflow-cpu 2.11.0 TensorFlow-Estimator 2.11.0
tensorflow-io-gcs-filesystem 0.30.0 Termcolor 2.2.0 abgeschlossen 0.13.1
Testpfad 0.5.0 thinc 8.1.7 Threadpoolctl 2.2.0
tokenize-rt 4.2.1 tokenizers 0.13.2 tomli 1.2.2
Fackel 1.13.1+cpu torchvision 0.14.1+cpu Tornado 6.1
tqdm 4.64.0 traitlets 5.1.1 Transformatoren 4.25.1
Typwächter 2.13.3 Typer 0.7.0 typing_extensions 4.1.1
ujson 5.1.0 unbeaufsichtigte Aktualisierungen 0,1 urllib3 1.26.9
virtualenv 20.8.0 Visionen 0.7.5 Wasabi 0.10.1
wcwidth (Breite eines Zeichens) 0.2.5 Webkodierungen 0.5.1 WebSocket-Client 0.58.0
Werkzeug 2.0.3 Was ist neu im Patch 1.0.4 Rad 0.37.1
widgetsnbextension 3.6.1 Eingehüllt 1.12.1 xgboost 1.7.2
yapf 0.31.0 zipp 3.7.0

Python-Bibliotheken für GPU-Cluster

Bibliothek Version Bibliothek Version Bibliothek Version
absl-py 1.0.0 argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0
Astor 0.8.1 asttokens 2.0.5 astunparse 1.6.3
Attrs 21.4.0 Azure Core 1.26.3 Azure-Cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.2.0 bcrypt 3.2.0
beautifulsoup4 4.11.1 schwarz 22.3.0 Bleichmittel 4.1.0
blis 0.7.9 boto3 1.21.32 Botocore 1.24.32
CacheWerkzeuge 4.2.2 Katalog 2.0.8 Kategorie-Kodierer 2.5.1.post0
Zertifikat 2021.10.8 cffi 1.15.0 Chardet 4.0.0
Charset-Normalizer 2.0.4 klicken 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.1.0 Konfekt 0.0.4 configparser 5.2.0
Convertdate 2.4.0 Kryptographie 3.4.8 Fahrradfahrer 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.15
databricks-cli 0.17.4 databricks-feature-store 0.10.0 dbl-tempo 0.1.12
dbus-python 1.2.16 debugpy 1.5.1 Dekorateur 5.1.1
defusedxml 0.7.1 Dill 0.3.4 Festplatten-Cache 5.4.0
Distlib 0.3.6 Docstring zu Markdown 0.11 Einstiegspunkte 0,4
Kurzlebig 4.1.4 ausführen 0.8.3 Übersicht der Facetten 1.0.0
fastjsonschema 2.16.2 fasttext 0.9.2 Dateisperrung 3.6.0
Flask 1.1.2 FlatBuffers 23.1.21 fonttools 4.25.0
fsspec 2022.2.0 Zukunft 0.18.2 gast 0.4.0
gitdb 4.0.10 GitPython 3.1.27 google-auth 1.33.0
google-auth-oauthlib 0.4.6 Google-Pasta 0.2.0 GRPCIO 1.42.0
gunicorn 20.1.0 gviz-api 1.10.0 h5py 3.6.0
Hijri-Konverter 2.2.4 Ferien 0.18 horovod 0.27.0
htmlmin 0.1.12 huggingface-hub 0.12.0 IDNA 3.3
ImageHash 4.3.1 Ungleichgewichte lernen 0.10.1 importlib-metadata 4.11.3
ipykernel 6.15.3 ipython 8.5.0 ipython-genutils 0.2.0
ipywidgets 7.7.2 isodate 0.6.1 es ist gefährlich 2.0.1
Jedi 0.18.1 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.1.1 joblibspark 0.5.1 jsonschema 4.4.0
Jupyter-Client 6.1.12 jupyter_core 4.11.2 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.0 Keras 2.11.0 kiwisolver 1.3.2
koreanischer Lunarkalender 0.3.1 langcodes 3.3.0 libclang 15.0.6.1
lightgbm 3.3.4 llvmlite 0.38.0 Mondkalender 0.0.9
Mako 1.2.0 Markdown 3.3.4 MarkupSafe 2.0.1
matplotlib 3.5.1 matplotlib-inline 0.1.2 mccabe 0.7.0
mistune 0.8.4 mleap 0.20.0 mlflow-skinny 2.1.1
multimethod 1.9.1 Murmurhash 1.0.9 mypy-Erweiterungen 0.4.3
nbclient 0.5.13 nbconvert 6.4.4 nbformat 5.3.0
nest-asyncio 1.5.5 networkx 2.7.1 Natural Language Toolkit (nltk) 3.7
nodeenv 1.7.0 Notebook 6.4.8 numba 0.55.1
numpy 1.21.5 oauthlib 3.2.0 opt-einsum 3.3.0
Verpackung 21,3 Pandas 1.4.2 Pandas-Profiling 3.6.2
Pandocfilter 1.5.0 paramiko 2.9.2 Parso 0.8.3
pathspec 0.9.0 pathie 0.10.1 patsy 0.5.2
Petastorm 0.12.1 pexpect 4.8.0 phik 0.12.3
pickleshare 0.7.5 Kissen 9.0.1 pip 21.2.4
platformdirs 2.6.2 plotly 5.6.0 plugin-fähig 1.0.0
pmdarima 2.0.2 vorgehäckselt 3.0.8 Prompt-Toolkit 3.0.20
prophet 1.1.1 protobuf 3.19.4 psutil 5.8.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
Pyarrow 7.0.0 Pyasn1 0.4.8 Pyasn1-Module 0.2.8
pybind11 2.10.3 Pycparser 2.21 Pydantisch 1.10.2
Pyflakes 2.5.0 Pygments 2.11.2 PyGObject 3.36.0
PyJWT 2.6.0 PyMeeus 0.5.12 PyNaCl 1.5.0
Pyodbc 4.0.32 Pyparsing 3.0.4 pyright 1.1.283
pyrsistent 0.18.0 Python-dateutil 2.8.2 python-editor 1.0.4
python-lsp-jsonrpc 1.0.0 Python-LSP-Server 1.6.0 Pytz 2021.3
PyWavelets 1.3.0 PyYAML 6,0 pyzmq 22.3.0
Regex 2022.3.15 requests 2.27.1 requests-oauthlib 1.3.1
requests-unixsocket 0.2.0 Seil 0.22.0 rsa 4.7.2
s3transfer 0.5.0 scikit-learn 1.0.2 SciPy 1.7.3
Seegeboren 0.11.2 Send2Trash 1.8.0 setuptools 61.2.0
setuptools-git 1.2 Schattierung 0.41.0 simplejson 3.17.6
Sechs 1.16.0 slicer 0.0.7 smart-open 5.2.1
smmap 5.0.0 Sieb für Suppe 2.3.1 Geräumig 3.4.4
spacy-legacy 3.0.12 spacy-loggers 1.0.4 Spark-Tensorflow-Distributor 1.0.0
sqlparse 0.4.2 srsly 2.4.5 ssh-import-id 5.10
Stapeldaten 0.2.0 StatistikModelle 0.13.2 tabellarisieren 0.8.9
tangled-up-in-unicode 0.2.0 Hartnäckigkeit 8.0.1 TensorBoard 2.11.2
tensorboard-data-server 0.6.1 tensorboard-plugin-profile (Tensorboard-Plugin-Profil) 2.11.1 tensorboard-plugin-wit 1.8.1
TensorFlow 2.11.0 TensorFlow-Estimator 2.11.0 tensorflow-io-gcs-filesystem 0.30.0
Termcolor 2.2.0 abgeschlossen 0.13.1 Testpfad 0.5.0
thinc 8.1.7 Threadpoolctl 2.2.0 tokenize-rt 4.2.1
tokenizers 0.13.2 tomli 1.2.2 Fackel 1.13.1+cu117
torchvision 0.14.1+cu117 Tornado 6.1 tqdm 4.64.0
traitlets 5.1.1 Transformatoren 4.25.1 Typwächter 2.13.3
Typer 0.7.0 typing_extensions 4.1.1 ujson 5.1.0
unbeaufsichtigte Aktualisierungen 0,1 urllib3 1.26.9 virtualenv 20.8.0
Visionen 0.7.5 Wasabi 0.10.1 wcwidth (Breite eines Zeichens) 0.2.5
Webkodierungen 0.5.1 WebSocket-Client 0.58.0 Werkzeug 2.0.3
Was ist neu im Patch 1.0.4 Rad 0.37.1 widgetsnbextension 3.6.1
Eingehüllt 1.12.1 xgboost 1.7.2 yapf 0.31.0
zipp 3.7.0

R-Bibliotheken

Die R-Bibliotheken sind mit den R-Bibliotheken in Databricks Runtime 12.2 LTS identisch.

Java- und Scala-Bibliotheken (Scala 2.12-Cluster)

Zusätzlich zu Java- und Scala-Bibliotheken in Databricks Runtime 12.2 LTS enthält Databricks Runtime 12.2 LTS ML die folgenden JAR-Dateien:

Rechencluster

Gruppen-ID Artefakt-ID Version
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.1.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-Cluster

Gruppen-ID Artefakt-ID Version
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.1.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0