Hacer una aplicación como

Cómo crear una aplicación de asistente virtual como Siri

Tabla de contenido ocultar 1 Cómo crear una aplicación como Siri 1.1 Creamos aplicaciones como Siri para obtener ayuda...

Escrito por Ashok Kumar · Lectura de 11 min >
Crea una aplicación de asistente virtual como Siri
Índice del contenido hide

Tiene una voz sedosa que suena muy dulce. Y ella siempre está dispuesta a acudir en tu ayuda: responder una pregunta, sugerir algo, ayudarte lo mejor que pueda. Y tiene un nombre maravilloso: Siri.

El hecho de que Siri, Aleksa, Cortana y el Asistente de Google no sean personas reales no los hace menos valiosos para nosotros. Los asistentes de voz nos hacen la vida más fácil porque están disponibles siempre que los necesitamos. Lo único que tenemos que hacer es decir “Oye…” e inmediatamente harán o buscarán lo que requerimos.

Cómo crear una aplicación como Siri

Crear aplicaciones de asistentes de voz virtuales como Siri ya no es una fantasía. Los asistentes virtuales ahorran tiempo y completan estas actividades para quienes están ocupados con sus vidas y no tienen tiempo para buscar o mantener sus teléfonos y sus vidas. Además, los asistentes virtuales no son sólo un software útil para los usuarios, sino también un amigo al que pueden acudir en busca de ayuda.

Creamos aplicaciones como Siri para obtener asistencia para las siguientes tareas:

  • Para hacer una llamada telefónica, enviar un mensaje y abrir y leer los mensajes que le han enviado
  • Aquí se pueden encontrar noticias, predicciones meteorológicas, moneda y definiciones.
  • Haga una lista de recordatorios y notas.
  • Programe reuniones y agregue eventos a un calendario.
  • Configure una alarma, ajuste el brillo de la pantalla, active/desactive la conexión Wi-Fi y reproduzca música en la pantalla.
  • Búsquedas de navegación: para mostrar la ruta del punto A al punto B.
  • Entretenimiento: qué está pasando en la ciudad, qué películas ver y dónde ir los fines de semana

La guía Cómo crear una aplicación como Siri Virtual Assistance

Incorporar asistentes virtuales a las funcionalidades de una app es actualmente un beneficio competitivo, pero en unos años se convertirá en un requisito necesario para mantener una app competitiva en el mercado y digna de la atención de los usuarios. Como resultado, usted debe comenzar a planificar su Desarrollo de aplicación móvil con asistencia virtual. lo antes posible con la ayuda de una tecnología de inteligencia artificial.

Hemos preparado una guía paso a paso sobre cómo crear una aplicación como Siri.

1er paso Haz una estrategia para tu aplicación como Siri.

Su aplicación de asistente de voz debe tener un objetivo claro en mente, así como centrarse en su grupo demográfico objetivo. Algunos asistentes de voz, como Cortana, se utilizan principalmente para tareas relacionadas con el trabajo, mientras que otros, como el Asistente de Google, se utilizan para tareas diarias. En esta etapa de la creación de la aplicación de asistente de voz, su trabajo es determinar qué tipo de servicio único brindará a sus usuarios y luego hablaremos sobre las funciones a incorporar.

Puede repasar las acciones que más tiempo realizan las personas todos los días y ver cómo su asistente de voz puede ayudarlo a automatizarlas.

Paso 2 Integre un asistente de voz en su aplicación con API personalizadas y herramientas de inteligencia artificial. 

La investigación de MindMeld ahora recomienda agregar e integrar un asistente de voz existente como Siri o Google, ya que se encuentran entre las principales opciones de los usuarios. Entonces, veamos estos dos.

Siri

Las aplicaciones de terceros han podido integrar Siri desde 2016, cuando Apple lanzó una herramienta especial llamada Apple SiriSDK, que proporciona dos tipos de extensiones para la integración de Siri: Intents, que maneja tareas como llamadas y mensajes, e Intents UI, que controla visualmente. contenido de marca y personalizado en la interfaz de usuario.

Estas extensiones de Intents son tareas que un usuario podría solicitar. El sistema los procesa como clases con ciertos atributos. Un usuario, por ejemplo, desea conocer la previsión meteorológica para la próxima semana en una ciudad determinada. Después de recibir una tarea de voz, el sistema determina sus propiedades (en este caso, fechas particulares y la ubicación indicada) y luego las envía a la extensión de la aplicación, que produce el resultado deseado.

Paso 3 Agrega funciones esenciales en tu propia aplicación como Siri

La siguiente es una lista de requisitos previos para crear un asistente de voz con IA desde cero:

Texto a voz/voz (STT)

Como agentes de software, los asistentes de voz sólo pueden procesar comunicaciones digitales. Como resultado, transforman las tareas de voz asignadas por los usuarios en texto para que puedan analizarse y realizarse. CMU Phoenix es un software que se puede utilizar para realizar este proceso.

TTS (tiempo hasta el éxito)

El proceso TTS es similar al proceso STT, pero funciona en la dirección opuesta. Los datos de texto, como la información meteorológica, se pueden traducir y entregar en voz humana mediante TTS. El software CMU Phoenix es una herramienta útil.

Tomando una desición

La efectividad de su aplicación de asistente de voz está determinada por este proceso. En este punto, la tecnología de inteligencia artificial examina la solicitud del usuario, la interpreta y responde. Para crear la respuesta se utiliza el etiquetado de componentes que son relevantes para el usuario. Por ejemplo, si un usuario desea encontrar una película para ver en un cine, un asistente de voz reúne todas las posibilidades disponibles que el usuario podría encontrar interesantes en función de solicitudes anteriores. Cuanto más inteligente es un asistente de voz, más comprende las preferencias del usuario y puede ofrecer una respuesta más relevante.

Reducción de ruido

En entornos abarrotados y ruidosos, la gente usa sus teléfonos en las calles, en cafés y en general. Esta configuración determina qué tan bien su asistente de IA puede escuchar a un usuario a pesar del ruido de fondo. La cancelación de ruido reduce o elimina los sonidos que no están relacionados con la voz del usuario o la solicitud.

Reconocimiento del habla

Lo más probable es que los asistentes malinterpreten a sus usuarios si no incluye tecnología de reconocimiento de voz en su asistente de voz. Como resultado, obtendrá una respuesta inexacta. Esto también le ayuda a evitar escenarios en los que un asistente de voz responde a voces de programas de televisión, sonidos de animales y otros sonidos divertidos.

Reducir la duración del discurso.

Esta característica se encarga de brindar una respuesta rápida al usuario. El servidor en el que se registra la comunicación del usuario debe ser confiable y seguro. Para evitar la pérdida de datos, se recomienda utilizar el estándar G.711.

Experiencia con UI/UX

La interfaz de Voz es lo que ve un usuario cuando realiza una solicitud: una pantalla, una voz, una forma de hablar, etc. Todo esto contribuye a la experiencia del cliente, ya que el consumidor desea no sólo una respuesta, sino también un servicio de alta calidad. Como resultado, considere la retroalimentación visual y audible que su aplicación brindará al usuario.

Existen varias plataformas en las que puedes construir tu propio asistente de IA, pero debes estar seguro de que este grupo de personas pueda proporcionar la funcionalidad que deseas en tu aplicación. Contáctenos no sólo para diseñar un asistente de voz para su organización, sino también para garantizar su eficiencia.

Tres formas eficientes de dotar a tu aplicación como Siri de un asistente virtual

El primer metodo
El primer método implica integrar tecnologías de voz existentes en su aplicación mediante API especiales y otras herramientas de desarrollo.
El segundo método
El segundo método le permite crear un asistente inteligente con la ayuda de servicios de código abierto y API disponibles de forma gratuita y de pago.
El tercer método
El tercer método es crear su propia aplicación como Siri desde cero con una mayor integración en su aplicación.

¿Cómo hacer la aplicación AI Voice Assistant?

Los asistentes de voz personales para Android impulsados ​​por Inteligencia Artificial (IA) ofrecen un gran potencial en el mundo digital actual. Ahora tenemos una gran cantidad de aplicaciones de asistentes de voz virtuales como Bixby, Siri, Cortana y Ok Google. Nuestras vidas son cada vez más lujosas y sencillas gracias a estos asistentes de voz inteligentes. Sin duda, estas aplicaciones virtuales impulsadas por IA se apoderarán de muchos aspectos de nuestras vidas en el futuro.

Sabemos que las aplicaciones de asistente de voz virtual con IA son compatibles con el 99.9% de los teléfonos Android. Las aplicaciones de asistente personal para Android son cada vez más populares. Es un tema de moda entre los ejecutivos de tecnología.

Siri es la mejor aplicación de asistente de voz para Android en este momento. Con el avance de la tecnología, una gran cantidad de alternativas a Siri han inundado el mercado. Todos los asistentes de voz tienen el mismo objetivo: hacerte la vida más fácil.

  • Las 6 mejores aplicaciones de inteligencia artificial para Android.
  • ¿Qué tecnologías se utilizaron para desarrollar una aplicación de asistente de voz?
  • ¿Cuánto cuesta desarrollar una aplicación como Cortana?
  • Beneficios a nivel empresarial del uso de asistentes de voz
  • Las 5 principales predicciones para el futuro del asistente de voz basado en IA

Paquetes requeridos toc

Para crear un asistente de voz personal, use el comando pip para instalar los siguientes paquetes en su sistema.

  1. Reconocimiento de voz: el reconocimiento de voz es una función clave en la domótica y la inteligencia artificial. La función principal de esta biblioteca es intentar interpretar todo lo que dicen los humanos y transformar el habla en texto.
  2. Pyttxs3: pyttxs3 es una biblioteca de conversión de texto a voz basada en Python. En Mac OS X, Windows y Linux, este paquete admite motores de texto a voz.
  3. Wikipedia: Wikipedia es una enciclopedia en línea multilingüe que utilizan muchas personas en el mundo académico, desde estudiantes de primer año hasta estudiantes y profesores, que desean aprender sobre un tema específico. Este paquete de Python extrae los datos necesarios de Wikipedia.
  4. Ecapture: este módulo le permite tomar fotografías con su cámara.
  5. Datetime: este es un módulo Python integrado que funciona con fechas y horas.
  6. SO: este módulo forma parte de la biblioteca estándar de Python y le permite comunicarse con el sistema operativo.
  7. Hora — El módulo de hora nos permite mostrar la hora actual.
  8. Navegador web: Python viene con un navegador web integrado. Recopila información de Internet.
  9. Subproceso: esta es una biblioteca estándar que se utiliza para procesar acciones del sistema, como cerrar sesión o reiniciar su computadora.
  10. Json: el módulo json se utiliza para el almacenamiento e intercambio de datos.
  11. solicitud: el módulo de solicitud se utiliza para enviar solicitudes HTTP de todo tipo. Acepta URL como parámetros y otorga acceso a las URL especificadas.
  12. Wolfram Alpha: Wolfram Alpha es una API que utiliza los algoritmos, la base de conocimientos y las tecnologías de inteligencia artificial de Wolfram para calcular respuestas de nivel experto. Wolfram Language lo hace posible.

Importa las siguientes bibliotecas

import speech_recognition as sr
import pyttsx3
import datetime
import wikipedia
import webbrowser
import os
import time
import subprocess
from ecapture import ecapture as ec
import wolframalpha
import json
import requests

Configurando el motor de voz:

La pyttsx3 El módulo se almacena en un motor de nombre variable.

Sapi5 es un motor de texto a voz de Microsoft que se utiliza para el reconocimiento de voz.

El ID de voz se puede configurar como 0 o 1,

0 indica voz masculina

1 indica voz femenina

engine=pyttsx3.init('sapi5')
voices=engine.getProperty('voices')
engine.setProperty('voice','voices[0].id')

Cree una función llamada hablar que convierta texto en voz. El texto se pasa como parámetro a la función de expresión, que inicializa aún más el motor.

ejecutar y esperar:

Mientras procesa todos los comandos actualmente en cola, esta función se bloquea. Invoca adecuadamente devoluciones de llamada para notificaciones del motor y regresa después de que todos los comandos en cola antes de esta llamada se hayan borrado de la cola.

Razones para hacer de Siri una aplicación de asistencia virtual

Prometimos convencerle de las ventajas financieras del desarrollo de asistentes de voz con inteligencia artificial y lo haremos utilizando los datos más recientes.

¿Qué opinan los usuarios de Siri y otros asistentes personales?

  • Según un estudio de Accenture Interactive, la mayoría de los clientes piensan que los asistentes virtuales son útiles y tienen una opinión favorable hacia ellos. Para ser más específicos, podemos decir…
  • La capacidad de los asistentes de voz para proporcionar respuestas específicas a preguntas es considerada la característica principal por el 80 por ciento de los usuarios.
  • Más de la mitad de los consumidores quieren que Siri (y otros asistentes personales como Siri) les proporcionen consejos útiles cuando compran en línea (por ejemplo, les gustaría saber de dónde provienen sus productos).
  • Cuando un asistente digital aprende a responder como una persona real, casi el 75% de los consumidores estarían encantados de comunicarse con él a diario.

¿Qué esperar en un futuro próximo en el mercado de asistentes de voz?

En primer lugar, los expertos de Juniper predicen que el número de dispositivos con capacidad de voz aumentará (hasta 870 millones en 2022, si hablamos de Estados Unidos).

Además, se prevé que las empresas de transporte, proveedores de servicios públicos y corporaciones de telecomunicaciones se unan a las filas de empresas dispuestas a integrar la tecnología de asistente de voz en sus plataformas móviles en un futuro próximo.

¿No es admirable lo que has logrado? Esto es especialmente cierto dado que la tecnología de voz aún se encuentra en sus primeras etapas de desarrollo.

¿Qué hace que Siri sea una aplicación de asistente de IA popular?

La palabra "Siri" tiene dos significados en noruego: "una mujer encantadora que te lleva al triunfo" y "secreto" en suajili. Al menos, así lo explicó uno de los diseñadores de Siri a los usuarios de la aplicación para iOS.

'Siri' significa Interfaz de reconocimiento e interpretación del habla, pero también tiene un significado más sensato. ¿No es increíblemente elocuente esta interpretación del nombre? Siri, según el sitio web, es un programa que detecta e interpreta la voz humana, lo que le permite hablar con los usuarios y responder a sus preguntas.

Siri ha progresado mucho en los últimos años, pero recordamos casos en los que puede reconocer la voz de una persona desconocida y comportarse de forma inapropiada, como iniciar una búsqueda, enviar un mensaje o realizar cualquier otra actividad no deseada. Afortunadamente, este ya no es el caso: los desarrolladores han trabajado duro para mejorar y Siri ahora nos habla en un tono agradable y ya no comete errores vergonzosos.

La historia de la mejora de Siri, por otro lado, es demasiado convincente para ignorarla. Además, esta historia puede ayudarle a desarrollar su propio asistente de voz móvil con IA.

Desarrollo de una App SIRI Like desde cero

Todos los asistentes de voz destacados, como Siri, están diseñados de esta manera, sin soluciones de terceros. El proceso es costoso y requiere mucho tiempo, pero el producto final sin duda vale la pena.

Deberá identificar e involucrar a desarrolladores experimentados y altamente calificados para crear su propio Siri desde cero. Hay mucho trabajo por hacer y no podrá manejarlo todo usted mismo: necesitará conectarse a sistemas de síntesis y reconocimiento de voz, activar el motor de procesamiento del lenguaje, diseñar una UI/UX única. , implementar la arquitectura y, por supuesto, probar exhaustivamente el producto final.

Las principales etapas del desarrollo de aplicaciones similares a SIRI 

Esta es la etapa del descubrimiento. Para empezar, debes decidir el concepto principal de la aplicación, investigar el mercado e idear una estrategia para seguir adelante.

VUI. El objetivo principal del siguiente paso de desarrollo es diseñar la interacción del usuario con el programa. Mientras un diseñador gráfico de UI crea mapas de pantalla de aplicaciones, un especialista en VUI planifica todas las interacciones posibles entre el usuario y el asistente de inteligencia artificial (con posibles desviaciones del escenario base).

¡En cualquier caso! Si agrega tecnología de voz como una nueva característica opcional a una aplicación existente, no necesitará una GUI (su aplicación ya tiene una, ¿verdad?). No puede prescindir de la interacción visual con el usuario si su objetivo es un programa de voz distinto orientado a ayudar al usuario a realizar tareas cotidianas simples utilizando una VUI (algo así como el Siri original antes de que Apple lo comprara). Si planeas crear una aplicación similar a Siri, ten esto en cuenta.

El desarrollo más importante. Se divide en dos secciones: crear un sistema de reconocimiento de voz y escribir lógica (lo que implica pensar cómo el futuro asistente de voz debería aceptar y responder las preguntas de los usuarios, de dónde obtiene los datos, con qué servicios coopera, etc.). Esta es una etapa muy difícil y puede utilizar una variedad de herramientas para ayudarlo, incluido Tensorflow de Google (¡Google no pudo evitar ofrecer tecnología genial para facilitar el trabajo de los desarrolladores!), Amazon Machine Learning (como su nombre lo indica, Amazon proporciona una herramienta para implementar el aprendizaje automático), Azure ML Studio y otros.

Pruebas . Cuando se trata de asistentes de voz, las pruebas son muy importantes. Verá, en el mundo de las interfaces gráficas, está limitado por lo que ha dibujado el diseñador: por ejemplo, si un botón no existe, el usuario no podrá tocarlo. Lamentablemente, todo es más complicado en el ámbito de los sonidos: el usuario es libre de decir lo que quiera. Como resultado, es una buena idea probar todas sus selecciones con anticipación.

Nombrar. Recuerda prestar mucha atención al nombre del asistente. Debido a que el usuario debe repetirlo en voz alta cada vez que se inicia el software, debería ser sencillo de escuchar.

Publicación del proyecto. Cuando se trata de aplicaciones móviles de asistente personal, también debemos examinar el estado de lanzamiento del proyecto en App Store y/o Google Play. Todo el procedimiento es bastante rutinario y probablemente ya lo sepas.

Cómo hacer que Siri suene como Jarvis

¿Aspiras a ser Iron Man? Tal vez no tengas los fondos, pero puedes hacer que la voz de Siri se parezca mucho a JARVIS, el asistente virtual de un rico ejecutivo de Stark Industries que trabaja como un hombre de acero. Aunque el efecto final no será espectacular, muchos amantes de los cómics lo encontrarán entretenido cuando sean niños. Es hora de darle una nueva voz a Siri y te mostraremos cómo hacerlo paso a paso.

La fantástica lección de Jeff Benjamin puede ayudarnos a trastear con una parte un tanto escondida del iPhone como es la modificación de este tipo de aspectos. En primer lugar, haga una copia de los efectos de sonido de Siri como copia de seguridad. (Simplemente guardarlos en nuestro disco duro) para que perderlos no requiera una restauración total del dispositivo.

Para comenzar, déjame decirte que debes hacer una copia de seguridad de tus efectos de sonido de Siri (a mí simplemente me gusta comprimirlos todos juntos) o los perderás para siempre. No estoy bromeando. Si no lo haces correctamente podrías acabar con un importante dolor de cabeza, así que presta mucha atención.

Cómo hacer que Siri suene como Jarvis: unos sencillos pasos

Copia de seguridad de todos los efectos de sonido

Paso 1: Iniciar iFile

Paso 2: Vaya a /Sistema/Biblioteca/Audio

Paso 3: Toca Editar

Paso 4: Seleccione UISonidos

Paso 5: Toca el botón Comprimir

Reemplazo de efectos de sonido de Siri

Paso 1: Descarga los efectos de sonido de Jarvis y envíalos por AirDrop a tu iPhone

Paso 2: Toque Unarchiver para extraer los archivos.

Paso 3: Toca Editar

Paso 4: Seleccione los cinco archivos (precedidos de jbl)

Paso 5: Toca el botón Portapapeles

Paso 6: Toque Cortar

Paso 7: Vaya a /Sistema/Biblioteca/Audio/UISounds

Paso 8: Toca Editar

Paso 9: Toca Pegar

Paso 10: Toca Sobrescribir todo

Paso 11: Reinicia tu iPhone (no respring)

Cambia tu voz de Siri a una voz británica

Paso 1: Configuración abierta

Paso 2: Toca General

Paso 3: Toca Siri

Paso 4: Toca Idioma

Paso 5: Toque Inglés (Reino Unido)

or

Cómo convertir a Siri en Jarvis

  1. Primero, inicie Cydia y agregue la fuente 'http://repo.cydro.us' a sus fuentes. Vaya a Fuentes > Editar > Agregar, puede hacerlo.
  2. Después de agregar el repositorio, vuelva a cargar sus fuentes y busque el paquete 'Jarvis para Siri' en la página 'Cambios'.
  3. Reinicie su dispositivo después de instalarlo e inicie Siri. Necesitas conseguir algunos sonidos nuevos.

También debes cambiar la voz de Siri a masculina después de instalar el parche Jarvis para Siri, ya que esto hará que el truco sea más realista. Seleccione Inglés (Reino Unido) como Idiomas y Masculino como Género de voz en Configuración > General > Siri para cambiar el género de Siri.

Escrito por Ashok Kumar
Director ejecutivo, fundador y director de marketing de Make An App Like. Soy escritor en OutlookIndia.com, KhaleejTimes, DeccanHerald. Contáctame para publicar tu contenido. Mi Perfil

Deje un comentario

Translate »