Puede acceder al curso completo aquí: Informática Aplicada de la visión con la Unidad y Azure

Tabla de contenidos

Parte 1

Introducción

En este supuesto, estaremos creando una aplicación que le permitirá tomar una foto y enviarla a una API que, donde se extrae y se le devolverá el texto en la imagen. Con este texto, vamos a continuación, enviarlo a un texto con el API de voz para tener la aplicación que lea el texto a nosotros.

¿Qué vamos a aprender?

  • servicios cognitivos Microsoft Azure nube ComputingUsing de Microsoft que son un conjunto de APIs de aprendizaje automático que podamos use.Computer Visión y Speech API.
  • JSONLearning lo que es un archivo JSON es, la información que vamos a ser el acceso y la forma en que vamos a tener acceso a ella en el interior de la Unidad.
  • solicitud web pre-hechos de Unity Web RequestsUnity system.We’ll a utilizar esto para enviar solicitudes a la API y descargar los datos resultantes.
  • Unidad de interfaz de usuario SystemWe’ll estar utilizando el construido en la interfaz de usuario del sistema para crear la imagen de la cámara del dispositivo para proyectar sobre el texto y para mostrar el texto.
  • Sistema de pre-hechos de webcam TexturesUnity para rendir lo que ve la cámara del dispositivo a una textura. Vamos a continuación, aplicaremos esta textura a la imagen de la interfaz de usuario para mostrar al usuario.

    Parte 2

    Creación de nuestra cuenta gratuita

    Lo primero que queremos hacer es ir a la página web de Microsoft Azure. A continuación, desea hacer clic en el botón Iniciar sesión . O bien acceder o crear una nueva cuenta de Microsoft.

    sitio web de Microsoft Azure

    Una vez que haya iniciado sesión, vamos a ir a la Servicios cognitivos ( Productos> AI + máquina de aprendizaje> cognitivo Servicios ).

    Servicios cognitivos son el aprendizaje de máquinas soluciones que podemos usar en nuestras aplicaciones. Si se desplaza hacia abajo, verá una lista de los diferentes servicios cognitivos. Para nuestro proyecto vamos a utilizar dos de ellos:


    • Visión -. Es una API que se llevará en una imagen y extraer el texto de la misma
    • Voz -. Es una API que se llevará en el texto y convertirlo a voz

      Las opciones de servicio cognitiva para Azure

      Para empezar a crear estas API (conocido como recursos ), vamos clic en el botón Portal en la cabecera. Esto nos llevará a nuestro Azure Portal .

      sitio web de Microsoft Azure con el enlace de Portal en círculos

      A continuación, haga clic nos dejó en el Crear un recurso botón y elegir cualquier recurso. Estamos haciendo esto con el fin de inscribirse para la prueba gratuita (seleccione cualquier recurso, por ahora, no importará lo que usted elija).

      Azure con Crear un recurso> Windows Server 2016 seleccionado» /> </ p><br />
<P> Esto debe cambiar una página que le pedirá que cree una cuenta gratis. Usted obtendrá crédito de $ 200 durante 30 días de forma gratuita. Haga clic en el botón Iniciar <strong> libre </ strong>. Esto le llevará a otra página. – simplemente haga clic en el botón Iniciar <strong> libre </ strong> en esa página también </ p><br />
<P> <img src =

      Ir a través de la forma y complete su información. Ten en cuenta que tendrá que tener un banco de crédito tarjeta de débito / /. No se le cobrará, sólo tiene que confirmar lo que eres y lo tienen en archivo si desea utilizar las opciones de pago en el futuro. Todo el tiempo que sea no utiliza el servicio después de 30 días o elimina la tarjeta de su cuenta, debe estar todo bien.

      signo Azure cuenta gratuita hasta la página

      Cuando se hace eso, usted debe ser enviado de nuevo al portal. A continuación, se muestra una notificación, diciendo que su juicio es activo con un crédito restante.

      notificación Azure con respecto al crédito

      En la siguiente lección, vamos a ser la creación de nuestro Computer Vision de recursos.

      Parte 3

      JSON Archivos

      En esta lección, vamos a estar creando nuestra Computer Vision de recursos. Esto nos permitirá enviar una imagen a la API y, a cambio, obtenemos el texto extraído. Este texto será devuelto a nosotros en la forma de un archivo JSON .

      Un archivo JSON es un archivo de texto que contiene objetos y propiedades. En el siguiente ejemplo, tenemos una lista de usuarios y un objeto para cada usuario. Un usuario tiene un nombre (cadena) y una edad (int). Se puede decir que un objeto que tenga estos corchetes {} y listas (o matrices) por los corchetes [] .

      Creación del sitio web

      Nos queda de la Portal última lección. Haga clic en el botón Crear un recurso .

      portal Azure con Crear un recurso seleccionado

      Búsqueda de “visión por ordenador” y seleccione la opción Computer Vision de recursos. Con eso abierto, haga clic en el botón Crear .

      Azure recursos página de Visión por Computador

      A continuación, queremos llenar las propiedades.


      • Nombre – lo que queremos llamar el recurso
      • suscripción – ponga esto en prueba gratis
      • Localización – Ponga aquí su ubicación
      • Precios de Nivel – active esta F0 (la capa gratuita)
      • Resource Group – Puede crear un grupo para esta aplicación a la que se acaba de clasificar los recursos (no es necesario, pero es una práctica bien)

        Una vez que se llena en todo, haga clic en el botón Crear en la parte inferior.

        ventana de creación de recursos para el recurso Azure visión por ordenador

        Este es ir de nuevo a la página principal del portal y debe haber una notificación diciendo que su recurso está desplegando. Después de completar este, debe haber un botón que dice Ir al recurso . Haga clic en eso y que le llevará al recurso.

        Para ver la información de los recursos que necesitamos, haga clic en la pestaña Descripción . A continuación, copiar o tomar nota de la Punto final . Esta es la API vamos a conectarse y enviar información a. También necesitamos una llave, así que haga clic en el botón Mostrar teclas de acceso … .

        ImageAnalyzer Introducción a la ventana en Azure

        A continuación, queremos copiar / mantener la nota de la clave 1 . Esta tecla nos identifica cuando se conecta a la API.

        llaves ImageAnalyzer en Azure para el uso de la API en la unidad

        En la siguiente lección, vamos a ser la creación de la Voz de recursos.

        Transcripción 1

        Hola a todos, mi nombre es Daniel Buckley, y estaré instructor de este curso. Vamos a hacer una aplicación que le permitirá tomar una foto a través de su cámara y luego tener que envió la imagen hasta un API, en la que se extrae el texto de ese cuadro, enviamos hacia abajo, y luego se convierte a partir de un texto a otro a voz a través de otra API.

        Lo primero que vamos a aprender acerca de la computación en nube es de Microsoft Azure, y nos va a configurar una cuenta y la creación de dos API de esto. Vamos en primer lugar estar creando API de visión de computadora, lo que nos permitirá enviar en una imagen y de vuelta a nosotros el texto extraído de esa imagen. A continuación, vamos a crear una API de voz, y esto nos permitirá enviar mensajes de texto hasta la API y de vuelta a nosotros un texto a archivos de audio de voz.

        Vamos también a utilizar archivos JSON. Este es el formato de archivo que vamos a llegar a cambio, cuando enviamos una solicitud al API de Visión por Computador. Se volverá a nosotros un archivo JSON, incluyendo todo el texto que se muestra en la pantalla. Vamos a aprender cómo ir a través de él, cómo entenderlo, lo que es, y cómo extraer el texto que necesitamos de él.

        Las solicitudes Unidad web son otra cosa que vamos a utilizar. Esta es la forma de envío y recepción de las peticiones web servidor a través de la red de la Unidad. C # tiene su propio sistema de sistema para esto ya, pero la Unidad de es mucho más simple, más fácil de usar, y en muchos aspectos más versátil, ya que tenemos que introducir en menos código. Es mucho más concisa y bueno para lo que necesitamos para el uso.

        Para atar todo esto junto, y mostrarlo en la pantalla, estaremos utilizando el Sistema de interfaz de usuario de la unidad, lo que nos permite proyectar la vista de la cámara en una imagen en la pantalla, y tienen texto que se muestra en la parte inferior. Con el fin de proyectar la vista de la cámara sobre la imagen, estaremos con WebCam texturas. Estas son las texturas que crea la Unidad que nos permite hacer lo que sea nuestra cámara ve, que siendo una webcam o una cámara del dispositivo, en una textura que se puede aplicar a cualquier cosa realmente. Podemos aplicarlo a las imágenes en la interfaz de usuario, como en nuestro ejemplo. Incluso podemos aplicarlo como una textura normal en cubos, modelos 3D, etcétera.

        ZENVA es una academia de aprendizaje en línea con más de 400.000 estudiantes. Contamos con una amplia gama de cursos, para las personas que están empezando, o para las personas que sólo quieren aprender algo nuevo. Los cursos son también muy versátil, y se puede aprender de muchas maneras diferentes. Si desea seguir junto con los videos tutoriales, hemos incluido los archivos de proyecto por supuesto que se puede utilizar. O simplemente puede ver los vídeos a lo largo de a su propio ritmo. De modo que todo lo dicho, vamos a empezar a trabajar en nuestro proyecto.

        Transcripción 2

        Bien, lo primero que quiero hacer es ir a la página web de Microsoft Azure aquí. Es sólo azure.microsoft.com, y se debe tomar a la página aquí. Ahora, tenemos entonces que entrar. Por lo tanto, nos basta con hacer clic en el botón Iniciar sesión aquí. Y entonces se puede elegir si desea iniciar sesión con una cuenta existente o crear una nueva cuenta de Microsoft. Si usted tiene una cuenta de Microsoft, sólo tiene que entrar con eso, como cualquier tipo de cuenta de Microsoft va a funcionar. Por lo tanto, sólo voy a una sesión.

        Por lo tanto, Microsoft Azure es un servicio computacional de la nube que nos brinda Microsoft. Tiene muchas aplicaciones y funciones diferentes que podemos utilizar en el interior de las aplicaciones. Para nosotros específicamente, sin embargo, vamos a estar usando la visión de computadora y los servicios de texto a voz. Estos son parte del paquete de servicios cognitivos. Así que podemos ir aquí hasta los productos, y en el interior aquí podemos entonces hacer clic en donde vemos AI + máquina de aprendizaje y servicios cognitivos.

        Ahora, los servicios cognitivos son, básicamente, el aprendizaje automático tipo de API y SDK podemos conectar. Si nos desplazamos hacia abajo, podemos ver un montón de las diferentes las de aquí. Tenemos la visión, que es la que vamos a estar conectando. Vamos a enviar a través de una imagen a la API, y luego se analiza el texto, y que volvemos a nosotros. También tenemos el discurso aquí. Hay también muchas otras funciones más pequeñas dentro de cada una de estas grandes categorías.

        Entonces, ¿qué vamos a hacer ahora es en realidad inscribirse en Azure, y hacerlo de modo que podemos empezar a crear algunos de estos recursos. Ahora, lo que podemos hacer, es entonces podemos hacer clic en el botón Portal aquí. Esto nos llevará a nuestro portal, que, básicamente, sólo tiene una lista de todos nuestros diferentes recursos. Todos los que pueden hacer y nos permite gestionar los recursos y nuestras aplicaciones. Por lo tanto, vamos a hacer clic en el botón Portal aquí.

        De acuerdo, cuando estamos en el Portal de ahora, lo que queremos hacer es en primer lugar, haga clic en el botón Crear una recurso aquí. Debido a que lo que tenemos que hacer es establecer realmente nuestra cuenta gratuita, que nos permitirá utilizar estos recursos. Por lo tanto, en realidad no importa cuál se hace clic en. Sólo tendremos que haga clic en el Windows Server 2016. No vamos a conseguir esto, pero nos esperan requieren para crear una cuenta gratuita. Esto es lo que vamos a necesitar para poder realmente utilizar y crear recursos.

        Ahora, con la cuenta gratuita se puede ver aquí que- puede ver en la marca de precio $ 200, pero eso significa que sólo podemos obtener crédito de $ 200 durante 30 días. Esto es básicamente como una prueba gratuita. Usted tendrá que registrarse con su tarjeta de crédito y número de teléfono, pero no se cargará a menos que vaya más allá de 30 días, o elegir uno de los niveles de precios reales cuando creamos un recurso.

        Por lo tanto, podemos simplemente haga clic en el botón de inicio gratuito aquí, y luego nos llevará a esta página aquí. Podemos hacer clic en Inicio Free de nuevo. Y entonces lo que desea es pasar por y llenar toda esta información aquí. Se le pedirá que acaba de entrar en su nombre, su número de teléfono. Usted no tiene que entrar en su ABN. A continuación, tiene que verificar mediante la adición de su tarjeta de crédito o tarjeta de crédito o tarjeta de débito. No hará ningún cargo. Estoy bastante seguro, pero es sólo allí para verificar su identidad. Y si desea firmar un compromiso aún más, a continuación, puede simplemente hacer que sea mucho más rápido entonces.

        Muy bien, así que cuando eso es completo, usted debe ser llevado de vuelta a esta página ahora. No debe parecer demasiado diferentes, pero lo que podemos hacer ahora es empezar a crear los recursos y eso es lo que vamos a hacer en el siguiente video. También puede ver aquí que dice que tienes tu prueba gratuita, y tiene crédito restante. Por lo tanto, que usted sabe que usted está en la prueba gratuita. Y sí, entonces estábamos listo para salir.

        Por lo tanto, nos vemos la próxima clase en la que vamos a empezar a crear un recurso real de la visión por ordenador.

        Transcripción 3

        De acuerdo, bienvenido de nuevo. En la última lección, hemos creado nuestra cuenta de Microsoft Azure y terminamos aquí en el portal. En esta lección, vamos a estar creando nuestra visión de recursos del ordenador, lo que nos permitirá conectar a la API de recursos de Visión por Computador, el envío de una imagen, y luego la API va a extraer el texto de la imagen y luego regresar a que nosotros como archivo JSON.

        Ahora, antes de continuar, vamos a repasar lo que es un archivo JSON. He aquí un ejemplo de ello. Se trata básicamente de un archivo de texto que contiene objetos y propiedades. Así que aquí tenemos, básicamente una lista de usuarios de aquí y entonces tenemos un objeto para cada usuario. Se puede decir que un objeto que tener estos estos corchetes y una lista o una matriz por tener corchetes aquí. Así que cada objeto aquí en este ejemplo tiene un nombre y una edad. El nombre es una cadena y la edad es de 25.

        Así que esto es básicamente una forma de- por lo que este es el formato que vamos a recibir nuestro texto. Se tendrá varios objetos, así, como cadena que contiene información que apenas viene con el servicio afín, pero vamos a estar buscando específicamente para objetos muy específicos, listas y bajando la jerarquía hasta que encontremos el texto que queremos realmente. Vamos a repasar más de lo que el archivo JSON real para nuestras miradas de visión por ordenador API como una vez que llegamos a las secuencias de comandos, ya que necesitamos saber cuando estamos haciendo eso.

        Muy bien, así que vamos a regresar al portal de aquí, y lo que queremos hacer en primer lugar es clic en el botón Crear recurso en la parte superior izquierda. Esto nos llevará a una lista en la que podemos seleccionar algo o buscar. Lo que vamos a hacer es que vamos a estar buscando la visión por ordenador, seleccionar esto y queremos crear un nuevo recurso de Visión por Computador. Por lo tanto hacemos clic en el botón Crear y entonces esto nos llevará a aquí. Lo que queremos hacer aquí es completar algunos datos.

        Lo primero que tenemos que hacer, en realidad, es crear un grupo de recursos. Ahora un recurso grupo- que no es tan importante lo que hacemos ya que no es necesario para cuando comenzamos secuencias de comandos en la unidad. Pero es sólo bueno para emparejar los servicios que usted va a utilizar en conjunto, básicamente, en un grupo. Por lo tanto, crear un nuevo grupo aquí, y vamos a llamar a este ImageReaderApp- y hacemos clic bien.

        Y ahora esto acerca de la aplicación de lector de imagen. Para el nombre, podemos llamar a este ImageReaderComputerVision. Como tal, y la suscripción que desea poner a prueba gratuito. Ubicación, se puede elegir la ubicación que está in- sea cual sea la ubicación Aquí se ve es cerca de usted. Yo soy de Australia del este, así que tendrá en Australia del este, y por el nivel de precios lo que queremos hacer es seleccionar el nivel de precios F0. Ya he creado un recurso visionario del ordenador antes de que en realidad probar la aplicación, pero usted debe tener una opción F0 aquí.

        Y entonces lo que podemos hacer es hacer clic en crear, y ya he creado uno así que voy a ir a la mía en este momento. Pero sólo haga clic en el botón Crear, y entonces usted debe tomar de nuevo al inicio del portal real aquí. Y en la parte superior derecha, si hacemos clic en la campana, debería ver que habrá una notificación aquí. Debería decir algo sobre el recurso está desplegando. Por lo tanto, tendrá una barra de carga que aquí se muestra que está desplegado. Y una vez que esté completo debe haber un botón que dice ir a los recursos y al hacer clic en eso, que le llevará a esta página aquí.

        En realidad, no tiene por qué ser en esta página aquí por defecto, así que lo que lo que vamos a hacer es que va a clic sobre el botón de visión general aquí y esto nos llevará a la página de información general. Ahora hay algunas cosas que, en realidad hay dos cosas que necesitamos para poder conectarse a la API una vez que estemos en la Unidad.

        Y eso es URL de punto final aquí. Por lo que necesitamos la URL de punto final aquí, así que sólo tienes que copiar y pegar que a un bloc de notas documento- acaban de esta página abierta para cuando lleguemos hasta el punto de scripting. Y entonces tenemos que hacer clic en las teclas de acceso cortos, ya que para poder conectarse a su recurso específico de la API, necesitamos una clave de acceso específica. Por lo que puede hacer clic en eso y nos mostrará tenemos dos teclas de acceso aquí. Ahora sólo necesitamos la llave uno, puede utilizar la tecla dos. En realidad, no importa cuál utiliza, pero sólo tendremos que utilizar una clave aquí. Así que sólo tienes que copiar una y otra vez que guardarlo en un documento de Bloc de notas (o simplemente esta página abierto, listo para scripting).

        En la siguiente lección que va a configurar un segundo recurso que va a ser, texto a voz utilizando los servicios del habla y hay un par de cosas diferentes que necesita para obtener de ese. Por lo tanto, estad atentos para eso.

        interesado en continuar? Echa un vistazo a la Visión por Ordenador Aplicada completa con la Unidad y azul claro, que es parte de nuestra EdTech Mini-Grado.

        Mensajes relacionados

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *