• 27 julio, 2024

Carlos Garsés

Profesional IT

Microsoft integra IA generativa en Windows con Copilot+

Microsoft quiere convertir Windows en un sistema operativo de IA y lanza las PC Copilot+

Microsoft quiere poner la Inteligencia Artificial generativa al frente de Windows y las computadoras que lo ejecutan.

En un par de conferencias durante su conferencia anual de desarrolladores Build esta semana, la compañía presentó una nueva línea de máquinas Windows que llama PC Copilot+, además de características con IA generativa como Recall, que ayuda a los usuarios a encontrar aplicaciones, archivos y otro contenido que han visto en el pasado. Copilot, la marca de IA generativa de Microsoft, pronto estará mucho más integrada en la experiencia de Windows 11. Y están por llegar nuevos dispositivos Surface de Microsoft.

Repasamos todos los principales anuncios de lunes y martes aquí.

Aplicaciones volumétricas

Microsoft está trayendo las Aplicaciones Volumétricas de Windows, básicamente aplicaciones de realidad virtual interactivas y conscientes del espacio, a los visores Meta Quest. A través de una asociación con Meta, Microsoft dice que entregará conectividad de Windows 365 y PC local a los visores Quest, permitiendo a los desarrolladores extender sus aplicaciones al espacio 3D.

Durante la conferencia del martes, Microsoft mostró una vista 3D explotada digital de un control de Xbox desde la perspectiva de un visor Meta Quest 3, un objeto digital que el usuario podía manipular con sus manos. “Estamos profundizando nuestra asociación con Meta para hacer de Windows una experiencia de primera clase en los dispositivos Quest”, dijo Pavan Davuluri, Vicepresidente Corporativo de Windows y dispositivos en Microsoft, durante la demostración.

Los desarrolladores pueden inscribirse para una vista previa y recibir acceso a la nueva API volumétrica de Microsoft.

PC Copilot+

Las PC Copilot+ de Microsoft son su visión del hardware Windows de primera línea con IA. Todas incluyen chips dedicados llamados NPU para alimentar experiencias de IA como Recall. Y vienen con un mínimo de 16GB de RAM, junto con almacenamiento SSD.

Las primeras PC Copilot+ tendrán los chips Snapdragon X Elite y Plus de Qualcomm, de los que Microsoft afirma que entregan hasta 15 horas de navegación web y 20 horas de duración de batería en video. Los fabricantes de chips Intel y AMD también están comprometidos a construir procesadores para dispositivos Copilot+ en asociación con una variedad de fabricantes, incluyendo Acer, Asus, Dell, HP, Lenovo y Samsung.

Las PC Copilot+ comienzan en $999 dólares, y algunas están disponibles para preventa hoy.

Surface Pro y Surface Laptop

Los nuevos dispositivos Surface de Microsoft, la Surface Laptop y la Surface Pro, se enfocan en rendimiento y duración de batería.

La última Surface Laptop, disponible con pantalla de 13.8 o 15 pulgadas, ha sido rediseñada con “líneas modernas” y biseles de pantalla más delgados. Dura hasta 22 horas con una carga y es hasta un 86% más rápida que la Surface Laptop 5, según la compañía. También soporta WiFi 7 y tiene un touchpad con respuesta háptica.

En cuanto a la nueva Surface Pro, Microsoft dice que es hasta un 90% más rápida que la generación anterior Surface Pro 9, y tiene una nueva pantalla OLED con HDR, WiFi 7 (y 5G opcional) y una cámara frontal ultra ancha mejorada. Además, su teclado desmontable, ahora reforzado con fibra de carbono adicional, tiene respuesta háptica.

Recall

La próxima función Recall de Windows 11 puede “recordar” aplicaciones y contenido que un usuario accedió en su PC semanas o incluso meses atrás, por ejemplo ayudándolo a encontrar un chat de Discord donde estaban discutiendo la ropa que consideraban comprar. Los usuarios pueden usar la línea de tiempo de Recall para “retroceder” y ver en lo que estaban trabajando en el pasado reciente y profundizar en archivos como presentaciones de PowerPoint para mostrar información potencialmente relevante para sus búsquedas.

Microsoft dice que Recall puede crear asociaciones entre colores, imágenes y más para permitir a los usuarios buscar prácticamente cualquier cosa en sus PC en lenguaje natural (no muy diferente a la tecnología de la startup Rewind); los desarrolladores podrán mejorar Recall agregando información contextual a sus aplicaciones. Y Microsoft afirma que todos los datos del usuario asociados con Recall se mantienen privados y en el dispositivo, y no se usan para entrenar modelos de IA, lo cual es importante.

Aquí hay más información de Microsoft: “Tus instantáneas son tuyas; permanecen localmente en tu PC. Puedes borrar instantáneas individuales, ajustar y borrar rangos de tiempo en Configuración, o pausar en cualquier momento desde el ícono en la Bandeja del Sistema en tu Barra de Tareas. También puedes filtrar que aplicaciones y sitios web nunca sean guardados.”

Edición de imágenes y traducciones en vivo

Ahora hay más IA en Windows que nunca, y algunas características exclusivas de las nuevas PC Copilot+.

Una nueva función llamada Súper Resolución puede restaurar fotos antiguas aumentando su resolución automáticamente. Y Copilot ahora puede analizar imágenes para darle ideas a los usuarios sobre composiciones creativas. A través de una función llamada Cocreator, los usuarios pueden generar imágenes y también pedir al modelo de IA que siga lo que están dibujando para cambiar o re-estilizar la imagen.

En otro lado, Subtítulos en Vivo con traducciones en vivo traduce cualquier audio que pase por una PC, ya sea de YouTube o un archivo local, al idioma que elija el usuario. Las traducciones en vivo inicialmente soportarán alrededor de 40 idiomas, incluyendo inglés, español, mandarín y ruso.

Una característica nueva pero relacionada en Microsoft Edge ofrece traducción de video en tiempo real en sitios como LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg y más. Que estará disponible en el futuro cercano, esta característica, que soporta la traducción de español a inglés e inglés a alemán, hindi, italiano, ruso y español, traduce el contenido hablado tanto mediante doblaje como subtítulos en vivo.

Team Copilot y extensiones

Team Copilot es la última expansión de la creciente suite de tecnología de IA generativa Copilot de Microsoft. Se integra con Teams, la aplicación de videoconferencias de la compañía, para ayudar a administrar agendas de reuniones y tomar notas que cualquiera en una reunión puede co-autor. Y se extiende a Loop y Planner, las plataformas de colaboración y planificación de Microsoft, para crear y asignar tareas, hacer un seguimiento de fechas límite y notificar a los miembros del equipo cuando se necesite su aporte.

En noticias relacionadas con Copilot, Microsoft ha lanzado (en vista previa privada) las Extensiones Copilot, que permiten a los desarrolladores extender la herramienta de generación de código GitHub Copilot con aplicaciones y habilidades de terceros. Los socios de lanzamiento incluyen DataStax, Docker y LambdaTest; las extensiones estarán en GitHub Marketplace, pero los desarrolladores también podrán crear sus propias extensiones privadas para integrarse con sus sistemas y APIs internos.

Windows Copilot Runtime

Alimentando capacidades como Recall y Súper Resolución está el Windows Copilot Runtime, una colección de ~40 modelos de IA generativa que conforman lo que Microsoft describe como “una nueva capa” de Windows. Junto con el índice semántico, un sistema basado en vectores local a cada PC Copilot+, el Windows Copilot Runtime permite que aplicaciones con IA generativa, incluyendo de terceros, se ejecuten sin necesariamente requerir una conexión a internet.

“[El runtime] consiste en APIs de IA listas para usar como Efectos de Estudio, Traducciones de Subtítulos en Vivo, OCR, Recall con actividad del usuario y [más], que estarán disponibles para desarrolladores en junio”, dijo Davuluri el martes.

Microsoft dice que CapCut, el popular editor de video del dueño de TikTok ByteDance, usará el Windows Copilot Runtime y la nueva Biblioteca Windows Copilot, un conjunto de APIs y herramientas de desarrollo de IA, para acelerar sus funciones de IA. Y Meta agregará los mencionados Efectos de Estudio a WhatsApp para entregar funciones como desenfoque de fondo y contacto visual durante videollamadas.

Construcción de bots mejorada

Azure AI Studio, el conjunto de herramientas dentro del Servicio Azure OpenAI de Microsoft que permite a los clientes combinar un modelo de IA y construir una aplicación que “razone” sobre esos datos, pronto permitirá a los desarrolladores crear aplicaciones usando APIs de inferencia de pago por uso, las APIs a través de las cuales los desarrolladores pueden acceder y ajustar modelos de IA generativa alojados en la infraestructura de Azure. Microsoft llama a esto “modelo como servicio”, y se lanza con modelos de Nixtla y Core42 para empezar.

En la suite de productos Copilot Studio adyacente, Microsoft está lanzando agentes Copilot, que la compañía describe como bots de IA que pueden “orquestar tareas de forma independiente adaptadas a roles y funciones específicas”. (Copilot Studio proporciona herramientas para conectar Copilot for Microsoft 365, el “copiloto” de IA en aplicaciones como Excel y Word, con datos de terceros). Aprovechando la memoria y el conocimiento del contexto, los agentes Copilot pueden navegar por diversos flujos de trabajo empresariales, aprendiendo del feedback del usuario y pidiendo ayuda cuando se encuentren con situaciones que no saben manejar.

Kit de desarrollo Snapdragon

Hay un nuevo kit de desarrollo de Qualcomm orientado a desarrolladores que crean aplicaciones para las PC Copilot+ con chips Arm.

El Kit de Desarrollo Snapdragon para Windows de $899,99 dólares, que mide aproximadamente el mismo ancho, altura y longitud que la Mac Mini de Apple, por cierto, alberga el chip Snapdragon X Elite de Qualcomm junto con 32GB de RAM, 512GB de almacenamiento y mucha entrada/salida. El kit de desarrollo soporta WiFi 7 y Bluetooth 5.4, y, a través de sus diversos puertos USB-C y HDMI, puede manejar hasta tres monitores 4K a la vez.

Phi-3

Microsoft anunció una adición a su familia de modelos de IA generativa Phi, Phi-3-vision, que puede realizar tareas generales de análisis y razonamiento visual, como responder preguntas sobre gráficos e imágenes. El modelo puede leer texto e imágenes y es lo suficientemente eficiente para correr en un dispositivo móvil.

Phi-3-vision está disponible en vista previa, mientras que las contrapartes de texto únicamente anunciadas previamente, Phi-3-mini, Phi-3-small y Phi-3-medium, ahora están generalmente disponibles.

Asociación con Khan Academy

Microsoft se está asociando con Khan Academy para donar acceso a infraestructura de cómputo en la nube, permitiendo a Khan Academy ofrecer a educadores en Estados Unidos acceso gratuito a las herramientas de IA de Khan Academy. Las dos compañías también colaborarán para explorar oportunidades de mejorar aplicaciones de IA para tutoría de matemáticas mediante IA generativa, dijo Microsoft el martes.

Vía | Microsoft integra IA generativa en Windows con Copilot+ – Tecnología con Juancho (tecnologiaconjuancho.com)

Por Juan Padra

Más de 40 años de experiencia en tecnología. DJ, enseñanza del español y radio en línea. Profesional versátil y apasionado de la música y la tecnología. ¡Bienvenido a mi perfil!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Verificado por MonsterInsights