La inteligencia artificial (IA) es una rama de la informática que se centra en la creación de sistemas capaces de realizar tareas que normalmente requieren inteligencia humana. Estas tareas incluyen el aprendizaje, el razonamiento, la percepción, la comprensión del lenguaje natural y la toma de decisiones. La IA se divide en dos categorías principales: la IA débil, diseñada para tareas específicas como asistentes virtuales y motores de búsqueda, y la IA fuerte, que tiene el potencial de realizar cualquier tarea cognitiva que pueda hacer un ser humano.
El desarrollo de la IA se ha visto impulsado por los avances en algoritmos, el aumento de la potencia de procesamiento y la disponibilidad de grandes cantidades de datos. Tecnologías como el aprendizaje automático y el aprendizaje profundo permiten a los sistemas de IA mejorar su rendimiento con el tiempo, adaptándose a nuevos datos y situaciones. La IA tiene aplicaciones en diversos campos, desde la medicina y la educación hasta la industria y el entretenimiento, transformando la forma en que vivimos y trabajamos.
Oracle ofrece una completa cartera de IA integrada en sus aplicaciones en la nube sobre la mejor infraestructura de IA de su clase y con innovaciones generadoras de IA de última generación.
Además, Oracle ha desarrollado una IA Generativa equipada con comprensión avanzada del lenguaje para crear la próxima generación de aplicaciones empresariales. Oracle Cloud Infrastructure (OCI) Generative IA es un servicio totalmente gestionado disponible a través de APIs para integrar sin problemas estos versátiles modelos lingüísticos en una amplia gama de casos de uso, incluyendo soporte de scripts, resumen y chat. Ahora sólo funciona bien en inglés, hemos probado la versión en español pero Oracle tiene que seguir formándose.
Para este artículo, nos vamos a centrar en los servicios de IA de Oracle y más adelante haremos un monográfico sobre IA generativa exclusivamente & Oracle Digital Assistant. Un buen desarrollo en la logística del lado de la orden de venta, introducido en la última versión de JD Edwards, es el cálculo de la fecha de preparación de la orden y la preferencia de la fecha de entrega basada en el calendario del día de trabajo.
OCI Language
OCI Language analiza texto no estructurado por usted. Proporciona modelos entrenados con datos del sector para realizar análisis lingüísticos sin necesidad de tener experiencia en ciencia de datos. Tiene cinco funciones principales.
En primer lugar, detecta el idioma del texto. Reconoce 75 lenguas, desde el afrikaans hasta el galés. Identifica entidades, como nombres, lugares, fechas, correos electrónicos, divisas, organizaciones, números de teléfono... 14 tipos en total. Identifica el sentimiento del texto, y no sólo un sentimiento para todo el bloque de texto, sino los distintos sentimientos para diferentes aspectos.
Por ejemplo, si lees una crítica de un restaurante en la que se dice que la comida está muy buena, pero que el servicio es pésimo. Obtendrás un sentimiento positivo para la comida y un sentimiento negativo para el servicio. También analiza el sentimiento de cada frase. Identifica frases clave en el texto que representan ideas o temas importantes. Clasifica el tema general del texto a partir de una lista de 600 categorías y subcategorías.
OCI Speech
OCI Speech es muy sencillo. Desbloquea los datos de las pistas de audio convirtiendo el habla en texto. Los desarrolladores pueden utilizar los modelos de lenguaje acústico de Oracle, de eficacia probada, para proporcionar una transcripción muy precisa de archivos de audio o vídeo en varios idiomas. OCI Speech transcribe automáticamente archivos de audio y vídeo a texto utilizando técnicas avanzadas de aprendizaje profundo. No requiere experiencia en ciencia de datos. Procesa los datos directamente en el almacenamiento de objetos y genera transcripciones con fecha y hora y gramaticalmente precisas.
OCI Speech es compatible con varios idiomas, en concreto inglés, español y portugués, y habrá más en el futuro. Es compatible con el procesamiento por lotes, lo que permite enviar varios archivos con una sola llamada. Procesamiento rapidísimo. Puede transcribir horas de audio en menos de 10 minutos. Para ello, divide el audio en segmentos más pequeños, transcribe cada segmento y los vuelve a unir en un único archivo.
OCI Speech hace que el texto transcrito sea más legible para parecerse a cómo escriben los humanos. Esto se denomina normalización. El servicio normaliza direcciones, horas, números, URL y otros datos. Por ejemplo, los usuarios de gestión de mezclas estarán encantados de saber que ahora será más fácil acceder a los informes de auditoría, disponibles justo a tiempo a petición del auditor. Estos informes le permitirán seguir y rastrear su producto a lo largo de todo el proceso.
OCI Vision
OCI Vision es un servicio de visión por ordenador que trabaja con imágenes. Ofrece dos funciones principales: el análisis de imágenes y la inteligencia artificial de documentos. El análisis de imágenes analiza imágenes fotográficas. La detección de objetos es la función que detecta objetos dentro de una imagen utilizando un cuadro delimitador y asignando una etiqueta a cada objeto con un porcentaje de precisión. La detección de objetos también localiza y extrae el texto que aparece en la escena, como en una señal.
La clasificación de imágenes asigna etiquetas de clasificación a la imagen identificando las principales características de la escena. Una de las capacidades más potentes del análisis de imágenes es que, además de los modelos pre entrenados, los usuarios pueden volver a entrenar los modelos con sus propios datos para adaptarlos a sus necesidades específicas. Para Argentina, ahora existe la opción de incluir o excluir ICMS en PIS/COFINS.
Ahora, la segunda gran capacidad de Visión se denomina IA de Documentos o Comprensión de Documentos.
OCI Document Understanding
Se utiliza para trabajar con imágenes de documentos. Se puede utilizar para entender PDFs o tipos de imágenes de documentos como JPEG, PNG y TIFF, o fotografías que contengan información textual. Las características de Document AI son el reconocimiento de texto, también conocido como OCR o Reconocimiento Óptico de Caracteres. Y esto extrae texto de imágenes, incluyendo escenarios no triviales como textos escritos a mano, además de documentos inclinados, sombreados o rotados.
La clasificación de documentos clasifica los documentos en 10 tipos diferentes basándose en el aspecto visual, las características de alto nivel y las palabras clave extraídas. Esto resulta útil cuando se necesita procesar un documento en función de su clasificación, como una factura, un recibo o un currículum. La detección del idioma analiza las características visuales del texto para determinar el idioma, en lugar de basarse en el propio texto. La extracción de tablas identifica las tablas de los documentos y extrae su contenido en forma tabular. La extracción de valores clave encuentra los valores de 13 campos y partidas comunes en los recibos, como el nombre del comerciante y la fecha de la transacción. Veamos un ejemplo de cómo funciona la consola OCI:
La imagen por defecto aquí es un recibo. Y detecta que es Inglés. Y extrae un montón de texto en bruto de este recibo. Puedes verlo. Todo lo que está resaltado aquí, que es todo el contenido del recibo, ha sido extraído. Y vemos lo que ha extraído aquí, tanto en formato de línea como en formato de palabra individual.
Ahora veamos si tiene algún valor clave. Y sí, lo tiene. Recuerda que para los recibos, tiene varias claves específicas que buscar. Y luego, si encuentra un valor coincidente, asignará ese valor a la clave. Así, obtenemos el nombre del comerciante, Ejemplo Café, la dirección del comerciante, el número de teléfono del comerciante, la hora de la transacción, la fecha de la transacción, mucha información en este recibo que es útil para procesarlo como un gasto.
Y también vemos los datos de la línea aquí abajo. Y también podemos ver los datos tabulares. Ha elegido dos artículos aquí, un Americano y un agua.
Esto nos da una idea de cómo funciona OCI Vision & Document.
OCI Anomaly Detection
OCI Anomaly Detection identifica anomalías en datos de series temporales. Los sensores de los equipos generan datos de series temporales, pero todo tipo de métricas empresariales también se basan en el tiempo. La característica única de este servicio es que encuentra anomalías no sólo en una única señal, sino en muchas señales a la vez. Esto es importante porque las máquinas a menudo generan varias señales a la vez, y las señales suelen estar relacionadas.
Piense en una bomba que tiene una presión de salida, un caudal, unas revoluciones por minuto y un consumo de corriente eléctrica. Cuando una bomba va a fallar, pueden aparecer anomalías en varias de esas señales, pero en momentos diferentes. La detección de anomalías de OCI le ayuda a identificar anomalías en un conjunto de datos multivariante aprovechando la interrelación entre las señales.
El servicio contiene algoritmos tanto para multiseñal, en multivariante. La señal única está en la detección de anomalías univariante, y determina automáticamente qué algoritmo utilizar en función de los datos de entrenamiento proporcionados. El algoritmo multivariante se llama MSET-2, que significa Técnica de Estimación de Estado Multivariante, y es exclusivo de Oracle.
El 2 del nombre hace referencia a las mejoras patentadas por los laboratorios de Oracle que identifican y corrigen automáticamente los problemas de calidad de los datos, lo que se traduce en menos falsas alarmas y resultados más precisos.
OCI REST API
Todos estos servicios de IA que hemos visto se pueden utilizar a través de la pila OCI y también se puede acceder a ellos a través de la API REST.
Puede escribir código contra la API REST o utilizar cualquiera de los diversos SDK de lenguaje que se muestran aquí. Pero para los científicos de datos que trabajan en OCI Data Science, tiene sentido utilizar Python.
En este artículo no descenderemos al nivel técnico. Pero hablaremos más en detalle sobre la IA Generativa de Oracle y su asistente digital y espero que sea más pronto que tarde. Mientras tanto, no dudes en ponerte en contacto con Quistor para obtener más información. Permanezca atento.
Antes de irse
No dude en hacernos cualquier pregunta, pedir más información o simplemente saludarnos en este formulario de contacto.