Nos hemos acostumbrado a usar la cámara de los móviles para hacer fotos, selfies o grabar vídeo, pero, gracias a la inteligencia artificial, los smartphones están aprendiendo a ver. Puede parecer un tanto pretencioso decir que un teléfono puede ver en el sentido literal de la palabra, pero los avances en las técnicas de reconocimiento de imágenes se suceden tan rápido que la realidad está superando a la ficción.
Google ya lleva tiempo ofreciendo la posibilidad de identificar lo que tenemos delante usando la cámara del móvil a través de apps y servicios como Google Goggles o Google Lens, pero otras empresas están trabajando para llevar esta funcionalidad a sus terminales. De hecho, Huawei ya lo ha conseguido integrando el "sentido de la vista" en sus teléfonos de una forma más fácil, intuitiva y, sobre todo, útil.
A ese "sentido de la vista" Huawei lo llama HiVision, y hemos usado un Huawei Mate 20 Pro para comprobar hasta dónde llegan sus posibilidades. HiVision también se puede encontrar en otros modelos de Huawei que ya están a la venta, y en los que se presenten en el futuro, como los Huawei P30, que será presentado en París el próximo 26 de marzo y cuyo lanzamiento retransmitiremos en directo desde Trendencias.
HiVision, nuestro ojito derecho digital
En vez de usar una aplicación independiente, Huawei ha llevado la habilidad de “ver” a la aplicación de la cámara de fotos y vídeo. Se accede a ella a través del icono "HiVisión", situado en la parte superior izquierda de la interfaz del modo "Foto". Al pulsar sobre él, entramos en el modo “ojo digital” capaz de ver lo que nosotros no vemos. Por ejemplo, puede “leer” códigos de barras y códigos QR, o identificar edificios, flores u objetos, obras de arte. Pero no de un modo genérico, sino que nos dirá qué flor es, qué edificio o qué objeto concreto estamos viendo a través de la cámara.
No solo se queda ahí, que ya es bastante. También puede traducir texto de un idioma a otro, o decirnos la composición o las calorías de un alimento. Y no de un alimento o ingrediente únicamente, también identifica platos cocinados, como pueda ser una fabada o una ensalada o Ramen.
Por último, pero no menos divertida, contempla una funcionalidad para identificar elementos del entorno y buscar en tiendas online posibles compras de productos iguales o similares. ¿Que te gusta un bolso? Apunta con HiVision y encuentra dónde puedes encontrar uno igual o que incluso te guste más.
Las compras, mejor con HiVision
El apartado de recomendaciones de compra está especialmente bien conseguido. En esta modalidad, HiVision busca productos para su compra online que estén relacionados con los objetos que estamos enfocando con la cámara del móvil. Puede ser el mismo producto o uno similar. La mayoría de las veces los objetos que recomienda son bastante acertados y pueden servir como fuente de inspiración para encontrar una prenda, un accesorio, un complemento o un regalo.
En este modo, una vez que HiVision ha delimitado la zona de interés, podemos modificar el tamaño de la ventana de selección de productos para centrarnos en uno concreto. Es decir, si estamos usando HiVision en un escaparate con decenas de productos, es posible centrar la selección en uno solo para que la inteligencia artificial busque con más precisión y nos inspire dentro de un repertorio menos disperso de recomendaciones.
Como campo de pruebas, hemos usado HiVision con algunos de los complementos que recomendábamos en este articulo. La aplicación ha identificado con precisión unos pendientes y ha hecho varias buenas recomendaciones.
Ver para creer, para traducir o para comer
El modo general de HiVision se inicia en "identificar", de manera que proceda al para reconocimiento de objetos. Aquí, HiVision se puede ver como una app de realidad aumentada capaz de reconocer edificios, objetos, flores, animales, cuadros, obras de arte, etcétera. No siempre será preciso al detalle: si apuntamos a montañas, no necesariamente nos dirá qué montañas o picos estamos viendo.
Junto con la información o descripción, tendremos en muchos casos enlaces a portales con detalles adicionales, como puede ser la Wikipedia o webs de referencia especializadas. Si enfocamos, por ejemplo, a Las Meninas, hace precisamente eso: nos dirige a una ficha con información y nos ofrece la posibilidad de pinchar en un hipervínculo que nos llevará a la Wikipedia.
Si apuntamos a un alimento, nos dirá qué calorías tiene y qué tipo de alimento es. Además, como decíamos antes, no solo identifica ingredientes o alimentos frescos, también platos cocinados, ofreciendo detalles sobre la composición alimentaria. Los detalles varían de un plato a otro, pero nos da una idea sobre la conveniencia o no de llevarnos a la boca determinadas comidas. O, si nos queremos dar un homenaje, sabremos con bastante precisión cuánto homenaje ha sido.
En la “wishlist” particular de peticiones para próximas versiones (¿quizás en el P30?), pediríamos que la cámara fuera capaz de detectar el peso aproximado de lo que estamos comiendo, para tener una idea más precisa de lo que estamos ingiriendo. O que este modo cayese fuera de la detección de objetos para mejorar la usabilidad de esta forma de uso de HiVision.
El traductor, por su parte, es una navaja suiza para los viajes, o para manejarnos en entornos de otras culturas o países. Cuenta con diez idiomas entre los que elegir: español, francés, ruso, italiano, alemán, portugués, chino, inglés, japonés y coreano para traducir los textos que pongamos delante de la cámara, superponiendo la traducción sobre el texto original.
Si vamos a un restaurante asiático, la traducción del menú con HiVision es de gran interés para saber qué pedir o qué estamos comiendo. Lo mismo se aplica si estamos de viaje y queremos comprender qué pone en un cartel, lo cual puede salvarnos de cometer errores. O puede hacer que encontremos los aseos sin necesidad de dar diez vueltas a un centro comercial.
Un QR vale más que unas decenas de palabras
La cuarta modalidad de uso de HiVision es identificar códigos QR o de barras. Estos son formas gráficas de empaquetar información. Suena muy "techie", pero con un ejemplo podemos explicarlo mejor. En un código QR como el que sigue hemos codificado la web www.trendencias.com. Si usamos HiVision para leerlo, nos llevará a la URL indicada.
Los teléfonos también empiezan a usar los códigos QR para compartir rápidamente diferentes datos, como direcciones web, contactos o datos con la configuración de una red WIFI. En vez de copiar todos los datos, o hacer una foto, leyendo el código QR o el de barras, accedemos a la información en cuestión de segundos sin hacer nada más.
En España no se usan tanto como en otros países, donde los códigos QR son la forma habitual de ofrecer ofertas comerciales con descuentos o promociones, por ejemplo. Aquí depende del entorno en el que nos movamos. Para entrar al cine, teatro y otros espectáculos, el código QR permite agilizar la recepción de los asistentes. En el día a día, el uso es menos habitual.
El próximo terminal HiVision: el P30
HiVision parece que estará también presente en los próximos terminales Huawei P30, que se presentarán el 26 de marzo próximo en París. Por lo que se desprende del vídeo, la familia P30 podrá “ver” bastante lejos. Y no solo verán la realidad, sino que la aumentarán. De esta y otras características tendremos oportunidad de hablar en el streaming en directo que realizaremos con motivo de su presentación el próximo día 26. Os esperamos.