使用Python SDK入门Azure机器学习

本文将使用适用于Python 3的Azure机器学习SDK来创建和实现Azure机器学习服务工作区 。 此工作区是云中使用Azure机器学习进行实验,学习和部署机器学习模型的主要构建块。




您将首先设置自己的Python环境和Jupyter Notebook服务器。 有关无需安装即可启动的信息,请参阅快速入门。 使用Azure门户开始使用Azure机器学习


在这个简短的教程中,您:


  • 安装Python SDK
  • 在Azure订阅中创建一个工作区。
  • 为工作区创建一个配置文件,稍后将在其他笔记本和脚本中使用该配置文件;
  • 写下将记录工作空间内值的代码;
  • 在工作区中查看记录的值。

您将创建一个工作空间及其配置文件,这些工作空间及其配置文件可用作与其他机器手册一起阅读其他手册和文章的必要组件。 与其他Azure服务一样,Azure机器学习也有一定的限制和配额。 详细了解配额以及如何发送其他配额请求。


如果您所在地区可用,则会将以下Azure资源自动添加到工作区中:



注意事项


本文中的代码需要Azure机器学习SDK 1.0.2或更高版本。 该代码已通过1.0.8版进行了测试。


如果您还没有Azure订阅,请在开始之前创建一个免费的Azure帐户。 试用免费或付费版本的Azure机器学习服务


安装SDK


重要!


如果您使用虚拟机来处理和分析Azure或Azure Databricks数据,请跳过本节。


  • 2018年9月27日之后创建的Azure数据处理和分析虚拟机随附已安装的Python SDK。
  • 在Azure Databricks环境中, 改为完成Databricks安装步骤


在安装SDK之前,建议您首先创建一个Python沙箱。 尽管本文使用了Miniconda ,但您也可以使用完全安装的Anaconda工具或Python virtualenv


Miniconda安装


下载并安装Miniconda 。 选择Python 3.7或更高版本进行安装。 不要选择Python2.x。


创建一个Python沙箱


  1. 打开命令提示符,然后创建一个名为myenv的conda环境并安装Python 3.6。 Azure机器学习SDK将与Python 3.5.2或更高版本一起使用,但是自动机器学习组件在Python 3.7中并不完全起作用。


    conda create -n myenv -y Python=3.6 
  2. 激活环境。


     conda activate myenv 

安装SDK


  1. 在激活的conda环境中,安装具有Jupyter Notebook功能的Azure机器学习SDK的核心组件。 安装过程需要几分钟,具体取决于计算机的配置。


      pip install --upgrade azureml-sdk[notebooks] 
  2. 在conda环境中安装Jupyter Notebook服务器。


     conda install -y nb_conda 
  3. 若要将此环境用于Azure机器学习教程,请安装以下程序包。


     conda install -y cython matplotlib pandas 
  4. 若要将此环境用于Azure机器学习教程,请安装自动机器学习组件。


     pip install --upgrade azureml-sdk[automl] 

创建工作区


使用Python SDK在Jupyter Notebook中创建工作区。


  1. 创建要用于快速入门指南和教程的目录,或导航到该目录。

  2. 要启动Jupyter Notebook,请输入以下命令:


     jupyter notebook 
  3. 在浏览器窗口中,使用标准Python 3内核创建笔记本。

  4. 要查看SDK版本,请在笔记本单元格中输入以下Python代码并执行。


     import azureml.core print(azureml.core.VERSION) 
  5. 在Azure门户的订阅列表中找到<azure-subscription-id>参数的值。 使用授予您所有者或成员角色的任何订阅。


     from azureml.core import Workspace ws = Workspace.create(name='myworkspace', subscription_id='<azure-subscription-id>', resource_group='myresourcegroup', create_resource_group=True, location='eastus2' ) 

    运行代码时,系统可能会提示您登录到Azure帐户。 登录时,身份验证令牌将被本地缓存。

  6. 要查看工作区信息,例如关联的保管库,容器注册表和密钥保管库,请输入以下代码。


     ws.get_details() 


配置文件输入


将工作空间信息保存在当前目录的配置文件中。 该文件称为aml_config \ config.json


通过此工作空间配置文件,可以轻松地进一步加载同一工作空间。 您可以使用同一目录或子目录中的其他笔记本和脚本下载它。


 # Create the configuration file. ws.write_config() # Use this code to load the workspace from # other scripts and notebooks in this directory. # ws = Workspace.from_config() 

这个API调用write_config()允许您在当前目录中创建一个配置文件。 config.json文件包含以下内容:


 { "subscription_id": "<azure-subscription-id>", "resource_group": "myresourcegroup", "workspace_name": "myworkspace" } 

使用工作区


运行使用SDK的基本API的代码来跟踪多个试运行。


  1. 在工作区中创建一个实验。
  2. 在实验中输入一个值。
  3. 输入实验中的值列表。

 from azureml.core import Experiment # Create a new experiment in your workspace. exp = Experiment(workspace=ws, name='myexp') # Start a run and start the logging service. run = exp.start_logging() # Log a single number. run.log('my magic number', 42) # Log a list (Fibonacci numbers). run.log_list('my list', [1, 1, 2, 3, 5, 8, 13, 21, 34, 55]) # Finish the run. run.complete() 

查看记录的结果


试用完成后,您可以在Azure门户上查看试验信息。 要显示位置URL和上一次运行的结果,请使用以下代码。


 print(run.get_portal_url()) 

使用链接在浏览器中的Azure门户上查看记录的值。


Azure门户中的注册值


资源清理


重要!


与其他Azure机器学习指南一起使用时,创建的资源可用作基本组件。


如果您不打算使用本文中创建的资源,请删除它们,以免产生任何费用。


 ws.delete(delete_dependent_resources=True) 

附加信息


在本文中,您创建了用于试验和部署模型的资源。 此外,您在笔记本中运行了代码,并在云中的工作区中研究了此代码的执行日志。


指导培训图像分类模型


您还可以在GitHub上学习更多高级示例

Source: https://habr.com/ru/post/zh-CN442132/


All Articles