Databricks Runtime 14.1 voor Machine Learning (EoS)

Opmerking

Ondersteuning voor deze Databricks Runtime-versie is beëindigd. Zie Beëindiging van ondersteuning en einde levenscyclus geschiedenis voor de einddatum van de ondersteuning. Voor alle ondersteunde Databricks Runtime-versies, zie Databricks Runtime release-opmerkingen over versies en compatibiliteit.

Databricks Runtime 14.1 voor Machine Learning biedt een kant-en-klare omgeving voor machine learning en gegevenswetenschap op basis van Databricks Runtime 14.1 (EoS). Databricks Runtime ML bevat veel populaire machine learning-bibliotheken, waaronder TensorFlow, PyTorch en XGBoost. Databricks Runtime ML bevat AutoML, een hulpprogramma voor het automatisch trainen van machine learning-pijplijnen. Databricks Runtime ML biedt ook ondersteuning voor gedistribueerde Deep Learning-training met behulp van Horovod.

Nieuwe functies en verbeteringen

Databricks Runtime 14.1 ML is gebouwd op databricks Runtime 14.1. Zie de releaseopmerkingen van Databricks Runtime 14.1, waaronder Apache Spark MLlib en SparkR, voor informatie over wat er nieuw is in Databricks Runtime 14.1 (EoS ).

Verbeteringen aan AutoML

AutoML-notebooks zijn nu opgeslagen als MLflow-artefacten.

Verbeteringen in Databricks Feature Store

U kunt nu automatisch een invoervoorbeeld afleiden en vastleggen wanneer u een model aanmeldt. Hiervoor stelt u infer_model_example in op True wanneer u log_modelbelt. Het voorbeeld is gebaseerd op de trainingsgegevens die zijn opgegeven in de training_set parameter.

Zie Databricks Feature Store voor meer informatie over Databricks Feature Store.

Systeemomgeving

De systeemomgeving in Databricks Runtime 14.1 ML verschilt als volgt van Databricks Runtime 14.1:

Databricks Runtime 14.1 ML bevat XGBoost 1.7.6, die geen ONDERSTEUNING biedt voor GPU-clusters met rekencapaciteit 5.2 en lager.

Bibliotheken

In de volgende secties worden de bibliotheken vermeld die zijn opgenomen in Databricks Runtime 14.1 ML die verschillen van de bibliotheken die zijn opgenomen in Databricks Runtime 14.1.

In deze sectie:

Hoogwaardige bibliotheken

Databricks Runtime 14.1 ML bevat de volgende bibliotheken van topkwaliteit:

Python bibliotheken

Databricks Runtime 14.1 ML maakt gebruik van Virtualenv voor Python pakketbeheer en bevat veel populaire ML-pakketten.

Naast de pakketten die in de volgende secties zijn opgegeven, bevat Databricks Runtime 14.1 ML ook de volgende pakketten:

  • hyperopt 0.2.7+db4
  • sparkdl-3.0.0_db1
  • automl 1.22.0

Als u de Databricks Runtime ML-Python-omgeving in uw lokale Python virtuele omgeving wilt reproduceren, downloadt u het bestand requirements-14.1.txt en voert u pip install -r requirements-14.1.txt uit. Met deze opdracht worden alle open source bibliotheken geïnstalleerd die door Databricks Runtime ML worden gebruikt, maar worden geen bibliotheken geïnstalleerd die zijn ontwikkeld door Databricks, zoals databricks-automl, databricks-feature-store of de Databricks-fork van hyperopt.

Python bibliotheken op CPU-clusters

Bibliotheek Versie Bibliotheek Versie Bibliotheek Versie
absl-py 1.0.0 versnellen 0.21.0 aiohttp 3.8.5
aiosignal 1.3.1 anyio 3.5.0 appdirs 1.4.4
argon2-cffi 21.3.0 argon2-cffi-bindingen 21.2.0 Astor 0.8.1
asttokens 2.0.5 astunparse 1.6.3 asynchrone time-out 4.0.3
attrs 22.1.0 audiolezen 3.0.0 azure-core 1.29.1
azure-cosmos 4.3.1 azure-storage-blob 12.18.1 azure-storage-file-datalake 12.13.1
terugbellen 0.2.0 bcrypt 3.2.0 beautifulsoup4 4.11.1
zwart 22.6.0 bleekmiddel 4.1.0 knipperlicht 1.4
gelukzaligheid 0.7.10 boto3 1.24.28 botocore 1.27.96
cachetools 5.3.1 catalogus 2.0.9 category-encoders 2.6.2
certificaat 2022.12.7 cffi 1.15.1 chardet 4.0.0
charset-normalizer 2.0.4 klikken 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.1.0 comm 0.1.2 suikergoed 0.1.3
configparser 5.2.0 contourpy 1.0.5 convertdate 2.4.0
cryptografie 39.0.1 wielrijder 0.11.0 cymem 2.0.8
Cython 0.29.32 daciet 1.8.1 databricks-automl-runtime 0.2.19
databricks-cli 0.17.7 databricks-feature-store 0.15.1 databricks-sdk 0.1.6
dataclasses-json 0.5.14 gegevenssets 2.14.4 dbl-tempo 0.1.23
dbus-python 1.2.18 debugpy 1.6.7 decorateur 5.1.1
deepspeed 0.10.0 defusedxml 0.7.1 dille 0.3.6
diskcache 5.6.3 distlib 0.3.7 docstring-to-markdown 0,11
invoerpunten 0,4 kortstondig 4.1.4 evalueren 0.4.0
Uitvoeren 0.8.3 facettenoverzicht 1.1.1 fastapi 0.98.0
fastjsonschema 2.18.0 fasttext 0.9.2 filelock 3.9.0
Flask 2.2.5 flatbuffers 23.5.26 fonttools 4.25.0
bevroren lijst 1.4.0 fsspec 2022.11.0 toekomst 0.18.3
gast 0.4.0 GCC-runtime-bibliotheek 1.10.0 gitdb 4.0.10
GitPython 3.1.27 google-api-core 2.11.1 google-auth 2.21.0
google-auth-oauthlib 1.0.0 google-cloud-core 2.3.3 google-cloud-storage 2.10.0
google-crc32c 1.5.0 google-pasta 0.2.0 google-resumable-media 2.6.0
googleapis-common-protos 1.60.0 greenlet 2.0.1 grpcio 1.48.2
grpcio-status 1.48.1 gunicorn 20.1.0 gviz-api 1.10.0
h11 0.14.0 h5py 3.7.0 hjson 3.1.0
vakantie 0,30 horovod (Russische volksdans) 0.28.1 htmlmin 0.1.12
httplib2 0.20.2 httptools 0.6.0 huggingface-hub 0.14.1
idna 3.4 ImageHash 4.3.1 onevenwichtig leren 0.10.1
importlib-metadata 4.11.3 importlib-resources 6.0.1 ipykernel 6.25.0
ipython 8.14.0 ipython-genutils 0.2.0 ipywidgets 7.7.2
isodate 0.6.1 itsdangerous 2.0.1 jedi 0.18.1
Jeepney 0.7.1 Jinja2 3.1.2 jmespath 0.10.0
joblib 1.2.0 joblibspark 0.5.1 jsonschema 4.17.3
jupyter-client 7.3.4 jupyter-server 1.23.4 jupyter_core 5.2.0
jupyterlab-pygments 0.1.2 jupyterlab-widgets 1.0.0 keras 2.13.1
sleutelhanger 23.5.0 kiwisolver 1.4.4 langchain 0.0.267
langcodes 3.3.0 langsmith 0.0.38 launchpadlib 1.10.16
lazr.restfulclient 0.14.4 lazr.uri 1.0.6 lazy_loader 0,3
libclang 15.0.6.1 librosa 0.10.1 lightgbm 4.0.0
llvmlite 0.39.1 Maankalender 0.0.9 lxml 4.9.1
Mako 1.2.0 Markdown 3.4.1 MarkupSafe 2.1.1
spek 3.20.1 matplotlib 3.7.0 matplotlib-inline 0.1.6
Mccabe 0.7.0 verkeerd stemmen 0.8.4 mlflow-skinny 2.7.1
more-itertools 8.10.0 mpmath 1.2.1 msgpack 1.0.5
multidict 6.0.4 multimethode 1.9.1 meerdere processen 0.70.14
murmurhash 1.0.10 mypy-extensions 0.4.3 nbclassic 0.5.2
nbclient 0.5.13 nbconvert 6.5.4 nbformat 5.7.0
nest-asyncio 1.5.6 networkx 2.8.4 ninja 1.11.1
nltk 3.7 nodeenv 1.8.0 notitieboek 6.5.2
notebook_shim 0.2.2 numba 0.56.4 numexpr 2.8.4
numpy 1.23.5 oauthlib 3.2.0 openai 0.27.8
openapi-schema-pydantic 1.2.4 opt-einsum 3.3.0 verpakking 22,0
Pandas 1.5.3 pandocfilters 1.5.0 paramiko 2.9.2
parso 0.8.3 pathspec 0.10.3 pathy 0.10.2
Patsy 0.5.3 petastorm 0.12.1 pexpect 4.8.0
phik 0.12.3 pickleshare 0.7.5 Kussen 9.4.0
pit 22.3.1 platformdirs 2.5.2 plotly 5.9.0
pluggy 1.0.0 pmdarima 2.0.3 hond 1.4.0
vooraf geslagen 3.0.9 prometheus-client 0.14.1 prompt-toolkit 3.0.36
profeet 1.1.4 protobuf 4.24.0 psutil 5.9.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
py-cpuinfo 9.0.0 pyarrow 8.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.11.1 pycparser 2.21
pydantic 1.10.6 pyflakes 3.0.1 Pygments 2.11.2
PyGObject 3.42.1 PyJWT 2.3.0 PyMeeus 0.5.12
PyNaCl 1.5.0 pyodbc 4.0.32 pyparsing 3.0.9
pyright 1.1.294 pyrsistent 0.18.0 pytesseract 0.3.10
python-dateutil 2.8.2 python-dotenv 1.0.0 python-editor 1.0.4
python-lsp-jsonrpc 1.0.0 python-lsp-server 1.7.1 pytoolconfig 1.2.5
pytz 2022.7 PyWavelets 1.4.1 PyYAML 6,0
pyzmq 23.2.0 regex 2022.7.9 verzoeken 2.28.1
requests-oauthlib 1.3.1 Reacties 0.18.0 touw 1.7.0
RSA 4.9 s3transfer 0.6.2 safetensors 0.3.3
scikit-learn 1.1.1 seaborn 0.12.2 SecretStorage 3.3.1
Send2Trash 1.8.0 sentence-transformers 2.2.2 zinsstuk 0.1.99
setuptools 65.6.3 Shap 0.42.1 simplejson 3.17.6
Zes 1.16.0 snijder 0.0.7 smart-open 5.2.1
smmap 5.0.0 sniffio 1.2.0 geluidsbestand 0.12.1
soepzeef 2.3.2.post1 soxr 0.3.6 spatie 3.6.1
spacy-legacy 3.0.12 spacy-loggers 1.0.5 spark-tensorflow-distributor 1.0.0
SQLAlchemy 1.4.39 sqlparse 0.4.2 srsly 2.4.7
ssh-import-id 5,11 stapelgegevens 0.2.0 starlette 0.27.0
statsmodels 0.13.5 sympy 1.11.1 tabel maken 0.8.10
tangled-up-in-unicode 0.2.0 vasthoudendheid 8.1.0 tensorboard 2.13.0
tensorboard-data-server 0.7.1 tensorboard-plugin-profile 2.13.1 tensorflow-cpu 2.13.0
tensorflow-estimator 2.13.0 tensorflow-io-gcs-filesystem 0.34.0 termcolor 2.3.0
voltooid 0.17.1 thinc 8.1.12 threadpoolctl 2.2.0
tiktoken 0.4.0 tinycss2 1.2.1 tokenize-rt 4.2.1
tokenisatoren 0.13.3 tomli 2.0.1 fakkel 2.0.1+cpu
torchvision 0.15.2+cpu tornado 6.1 tqdm 4.64.1
traitlets 5.7.1 Transformatoren 4.31.0 typeguard 2.13.3
Typer 0.9.0 typinspectie 0.9.0 typing_extensions 4.4.0
ujson 5.4.0 upgrades zonder toezicht 0,1 urllib3 1.26.14
uvicorn 0.23.2 uvloop 0.17.0 virtualenv 20.16.7
Visioenen 0.7.5 wadllib 1.3.6 wasabi 1.1.2
watchfiles 0.20.0 wcwidth 0.2.5 webencodings 0.5.1
websocket-client 0.58.0 websockets 11.0.3 Gereedschap 2.2.2
whatthepatch 1.0.2 wiel 0.38.4 widgetsnbextension 3.6.1
woordwolk 1.9.2 gewikkeld 1.14.1 xgboost 1.7.6
xxhash 3.3.0 yapf 0.31.0 yarl 1.9.2
ydata-profiling 4.2.0 zipp 3.11.0

Python bibliotheken op GPU-clusters

Bibliotheek Versie Bibliotheek Versie Bibliotheek Versie
absl-py 1.0.0 versnellen 0.21.0 aiohttp 3.8.5
aiosignal 1.3.1 anyio 3.5.0 appdirs 1.4.4
argon2-cffi 21.3.0 argon2-cffi-bindingen 21.2.0 Astor 0.8.1
asttokens 2.0.5 astunparse 1.6.3 asynchrone time-out 4.0.3
attrs 22.1.0 audiolezen 3.0.0 azure-core 1.29.1
azure-cosmos 4.3.1 azure-storage-blob 12.18.1 azure-storage-file-datalake 12.13.1
terugbellen 0.2.0 bcrypt 3.2.0 beautifulsoup4 4.11.1
zwart 22.6.0 bleekmiddel 4.1.0 knipperlicht 1.4
gelukzaligheid 0.7.10 boto3 1.24.28 botocore 1.27.96
cachetools 5.3.1 catalogus 2.0.9 category-encoders 2.6.2
certificaat 2022.12.7 cffi 1.15.1 chardet 4.0.0
charset-normalizer 2.0.4 klikken 8.0.4 cloudpickle 2.0.0
cmake 3.27.5 cmdstanpy 1.1.0 comm 0.1.2
suikergoed 0.1.3 configparser 5.2.0 contourpy 1.0.5
convertdate 2.4.0 cryptografie 39.0.1 wielrijder 0.11.0
cymem 2.0.8 Cython 0.29.32 daciet 1.8.1
databricks-automl-runtime 0.2.19 databricks-cli 0.17.7 databricks-feature-store 0.15.1
databricks-sdk 0.1.6 dataclasses-json 0.5.14 gegevenssets 2.14.4
dbl-tempo 0.1.23 dbus-python 1.2.18 debugpy 1.6.7
decorateur 5.1.1 deepspeed 0.10.0 defusedxml 0.7.1
dille 0.3.6 diskcache 5.6.3 distlib 0.3.7
docstring-to-markdown 0,11 einops 0.6.1 invoerpunten 0,4
kortstondig 4.1.4 evalueren 0.4.0 Uitvoeren 0.8.3
facettenoverzicht 1.1.1 fastapi 0.98.0 fastjsonschema 2.18.0
fasttext 0.9.2 filelock 3.9.0 flash-attn 2.0.8
Flask 2.2.5 flatbuffers 23.5.26 fonttools 4.25.0
bevroren lijst 1.4.0 fsspec 2022.11.0 toekomst 0.18.3
gast 0.4.0 GCC-runtime-bibliotheek 1.10.0 gitdb 4.0.10
GitPython 3.1.27 google-api-core 2.11.1 google-auth 2.21.0
google-auth-oauthlib 1.0.0 google-cloud-core 2.3.3 google-cloud-storage 2.10.0
google-crc32c 1.5.0 google-pasta 0.2.0 google-resumable-media 2.6.0
googleapis-common-protos 1.60.0 greenlet 2.0.1 grpcio 1.48.2
grpcio-status 1.48.1 gunicorn 20.1.0 gviz-api 1.10.0
h11 0.14.0 h5py 3.7.0 hjson 3.1.0
vakantie 0,30 horovod (Russische volksdans) 0.28.1 htmlmin 0.1.12
httplib2 0.20.2 httptools 0.6.0 huggingface-hub 0.14.1
idna 3.4 ImageHash 4.3.1 onevenwichtig leren 0.10.1
importlib-metadata 4.11.3 importlib-resources 6.0.1 ipykernel 6.25.0
ipython 8.14.0 ipython-genutils 0.2.0 ipywidgets 7.7.2
isodate 0.6.1 itsdangerous 2.0.1 jedi 0.18.1
Jeepney 0.7.1 Jinja2 3.1.2 jmespath 0.10.0
joblib 1.2.0 joblibspark 0.5.1 jsonschema 4.17.3
jupyter-client 7.3.4 jupyter-server 1.23.4 jupyter_core 5.2.0
jupyterlab-pygments 0.1.2 jupyterlab-widgets 1.0.0 keras 2.13.1
sleutelhanger 23.5.0 kiwisolver 1.4.4 langchain 0.0.267
langcodes 3.3.0 langsmith 0.0.38 launchpadlib 1.10.16
lazr.restfulclient 0.14.4 lazr.uri 1.0.6 lazy_loader 0,3
libclang 15.0.6.1 librosa 0.10.1 lightgbm 4.0.0
Verlicht 16.0.6 llvmlite 0.39.1 Maankalender 0.0.9
lxml 4.9.1 Mako 1.2.0 Markdown 3.4.1
MarkupSafe 2.1.1 spek 3.20.1 matplotlib 3.7.0
matplotlib-inline 0.1.6 Mccabe 0.7.0 verkeerd stemmen 0.8.4
mlflow-skinny 2.7.1 more-itertools 8.10.0 mpmath 1.2.1
msgpack 1.0.5 multidict 6.0.4 multimethode 1.9.1
meerdere processen 0.70.14 murmurhash 1.0.10 mypy-extensions 0.4.3
nbclassic 0.5.2 nbclient 0.5.13 nbconvert 6.5.4
nbformat 5.7.0 nest-asyncio 1.5.6 networkx 2.8.4
ninja 1.11.1 nltk 3.7 nodeenv 1.8.0
notitieboek 6.5.2 notebook_shim 0.2.2 numba 0.56.4
numexpr 2.8.4 numpy 1.23.5 oauthlib 3.2.0
openai 0.27.8 openapi-schema-pydantic 1.2.4 opt-einsum 3.3.0
verpakking 22,0 Pandas 1.5.3 pandocfilters 1.5.0
paramiko 2.9.2 parso 0.8.3 pathspec 0.10.3
pathy 0.10.2 Patsy 0.5.3 petastorm 0.12.1
pexpect 4.8.0 phik 0.12.3 pickleshare 0.7.5
Kussen 9.4.0 pit 22.3.1 platformdirs 2.5.2
plotly 5.9.0 pluggy 1.0.0 pmdarima 2.0.3
hond 1.4.0 vooraf geslagen 3.0.9 prompt-toolkit 3.0.36
profeet 1.1.4 protobuf 4.24.0 psutil 5.9.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
py-cpuinfo 9.0.0 pyarrow 8.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.11.1 pycparser 2.21
pydantic 1.10.6 pyflakes 3.0.1 Pygments 2.11.2
PyGObject 3.42.1 PyJWT 2.3.0 PyMeeus 0.5.12
PyNaCl 1.5.0 pyodbc 4.0.32 pyparsing 3.0.9
pyright 1.1.294 pyrsistent 0.18.0 pytesseract 0.3.10
python-dateutil 2.8.2 python-dotenv 1.0.0 python-editor 1.0.4
python-lsp-jsonrpc 1.0.0 python-lsp-server 1.7.1 pytoolconfig 1.2.5
pytz 2022.7 PyWavelets 1.4.1 PyYAML 6,0
pyzmq 23.2.0 regex 2022.7.9 verzoeken 2.28.1
requests-oauthlib 1.3.1 Reacties 0.18.0 touw 1.7.0
RSA 4.9 s3transfer 0.6.2 safetensors 0.3.3
scikit-learn 1.1.1 seaborn 0.12.2 SecretStorage 3.3.1
Send2Trash 1.8.0 sentence-transformers 2.2.2 zinsstuk 0.1.99
setuptools 65.6.3 Shap 0.42.1 simplejson 3.17.6
Zes 1.16.0 snijder 0.0.7 smart-open 5.2.1
smmap 5.0.0 sniffio 1.2.0 geluidsbestand 0.12.1
soepzeef 2.3.2.post1 soxr 0.3.6 spatie 3.6.1
spacy-legacy 3.0.12 spacy-loggers 1.0.5 spark-tensorflow-distributor 1.0.0
SQLAlchemy 1.4.39 sqlparse 0.4.2 srsly 2.4.7
ssh-import-id 5,11 stapelgegevens 0.2.0 starlette 0.27.0
statsmodels 0.13.5 sympy 1.11.1 tabel maken 0.8.10
tangled-up-in-unicode 0.2.0 vasthoudendheid 8.1.0 tensorboard 2.13.0
tensorboard-data-server 0.7.1 tensorboard-plugin-profile 2.13.1 tensorflow 2.13.0
tensorflow-estimator 2.13.0 tensorflow-io-gcs-filesystem 0.34.0 termcolor 2.3.0
voltooid 0.17.1 thinc 8.1.12 threadpoolctl 2.2.0
tiktoken 0.4.0 tinycss2 1.2.1 tokenize-rt 4.2.1
tokenisatoren 0.13.3 tomli 2.0.1 fakkel 2.0.1+cu118
torchvision 0.15.2+cu118 tornado 6.1 tqdm 4.64.1
traitlets 5.7.1 Transformatoren 4.31.0 Triton 2.0.0
typeguard 2.13.3 Typer 0.9.0 typinspectie 0.9.0
typing_extensions 4.4.0 ujson 5.4.0 upgrades zonder toezicht 0,1
urllib3 1.26.14 uvicorn 0.23.2 uvloop 0.17.0
virtualenv 20.16.7 Visioenen 0.7.5 wadllib 1.3.6
wasabi 1.1.2 watchfiles 0.20.0 wcwidth 0.2.5
webencodings 0.5.1 websocket-client 0.58.0 websockets 11.0.3
Gereedschap 2.2.2 whatthepatch 1.0.2 wiel 0.38.4
widgetsnbextension 3.6.1 woordwolk 1.9.2 gewikkeld 1.14.1
xgboost 1.7.6 xxhash 3.3.0 yapf 0.31.0
yarl 1.9.2 ydata-profiling 4.2.0 zipp 3.11.0

R-bibliotheken

De R-bibliotheken zijn identiek aan de R-bibliotheken in Databricks Runtime 14.1.

Java en Scala-bibliotheken (Scala 2.12-cluster)

Naast Java- en Scala-bibliotheken in Databricks Runtime 14.1 bevat Databricks Runtime 14.1 ML de volgende JAR's:

CPU-clusters

Groeps-id Artefact-ID Versie
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db2-spark3.4
org.mlflow mlflow-client 2.7.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-clusters

Groeps-id Artefact-ID Versie
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db2-spark3.4
org.mlflow mlflow-client 2.7.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0