Smart room

Una Smart Room se define como una sala inteligente. Es una sala equipada con equipos que recogen información sobre las personas que se encuentran en su interior, analizan los datos recibidos e interactúan con el usuario. Este tipo de salas están concebidas principalmente para obtener nuevas experiencias, ya sean de carácter educativo como si son de carácter lúdico.

Tecnologías implicadas[editar]

Este tipo de salas constan de varias tecnologías asociadas. Las podemos dividir en dos grandes bloques, tecnologías acústicas y tecnologías visuales. Cada una de estas tecnologías se encargarán de proporcionar inteligencia artificial a la sala. Después de tratar cada una de las señales recibidas por los sensores acústicos y ópticos la sala podrá interactuar con el usuario o usuario.

Tecnologías acústicas[editar]

Se reparten sensores acústicos (micrófonos)por toda la sala. Estos analizan el flujo de datos que reciben de la sala y lo procesan. Los datos obtenidos de los sensores se ayudan a interpretar el entorno, decidir y evaluar. Hay diversos tipos de tecnologías implicadas en el apartado acústico. A continuación se describen las tecnologías utilizadas en lo que a sonido se refiere:

Reconocimiento automático del habla[editar]

Permite la comunicación hablada entre los usuarios y los equipos. Estos sistemas son capaces de capturar la voz, procesarla y reconocer la información contenida en ella.

Identificación del hablante[editar]

Se encarga de reconocer al usuario que se sitúa dentro de la sala. Esta operación se puede hacer en dos fases:

1.Se registra la voz de la persona o personas que se desean reconocer. Ser extraen parámetros característicos de la voz de cada uno de los registros.

2.Se procesa la captura de los sensores acústicos y se cotejan con los registros obtenidos de la fase anterior.

Detección de actividad del habla[editar]

Se encarga de reconocer si dentro de la sala hay algún tipo de conversación. Detecta si alguna de las personas dentro de la sala está hablando.

Localización de fuente acústica[editar]

Se encarga de localizar dentro de la sala de donde viene el sonido. Este tipo de localización es complicado, ya que al tener varios micrófonos repartidos por la sala, se han de tener en cuenta muchas variables, tales como el retardo de llegada de señal de un micrófono a otro.

Detección de eventos acústicos[editar]

Se encarga de detectar si dentro de la sala hay algún tipo de evento acústico. Normalmente lo que nos interesan son los eventos de acústicos producidos por los usuarios de la sala. La sala debe incorporar varios sistemas de reducción de ruido ambiente para así poder captar de manera correcta a los usuarios.

Síntesis de voz[editar]

Es la parte que se encarga de sintetizar la voz de la sala. Este tipo de salas suelen contener sintetizadores de voz para dotar a la sala de una voz para comunicarse con los usuarios.

Tecnologías visuales[editar]

A parte de dotar a las salas con "oídos" para que escuchen, también las dotamos con "ojos". Este tipo de salas están dotadas de diversas cámaras repartidas por todo el espacio. Las tecnologías visuales ayudan a entender lo que hace el usuario. Ahora el usuario está siendo observado por la sala, no solo su rostro sino también sus movimientos y gestos. Diversos métodos se encargan de proporcionar información visual a la sala. A continuación se describen las tecnologías visuales utilizadas:

Localización multi-cámara[editar]

Se localiza al sujeto dentro de la sala mediante varias cámaras. La información recibida de las cámaras que captan al individuo sirve para proporcionar su situación dentro de la sala.

Detección de caras e identificación[editar]

Una serie de métodos son utilizados para detectar la cara del sujeto que está dentro de la sala. Mediante una serie de algoritmos la sala es capaz de reconocer la identidad del usuario mediante el reconocimiento de su cara. Previaemente se ha de colocar una foto del sujeto que se desea reconocer, después los algoritmos se encargan de obtener similitudes entre lo que capta la cámara y la base que tiene archivada.

Análisis corporal y estimación de la posición de la cabeza[editar]

De las imágenes que se recogen de la sala, se segmentan para obtener el cuerpo del sujeto que está en la sala. Mediante el análisis de las imágenes obtenidas, se obtienen estimaciones de la posición del cuerpo, y de la cabeza.

Reconocimiento Gestual[editar]

Mediante una serie de algoritmos se estudian las imágenes recogidas por las cámaras y se examinan los movimientos de uno o varios sujetos dentro de la sala. Esto puede dar información acerca de la actividad que está llevando a cabo por cada una de las personas que estén dentro de la sala.

Detección de objetos y análisis[editar]

Mediante una serie de algoritmos se detectan los objetos que están en la sala. Después se analizan y se estudia la posición en la que están. Anteriormente el sistema tiene que tener un archivo de objetos a reconocer.

Detección de texto[editar]

Los sistemas son capaces de tratar cada una de las imágenes que llegan de las cámaras para así detectar el texto. Cada una de las imágenes es procesada para separar el texto y evaluarlo.

Detección global de actividad[editar]

El sistema está preparado para poder hacer detectar la actividad que se lleva a cabo dentro de la sala.

Combinación de tecnologías[editar]

Identificación de personas[editar]

Mediante la combinación de lo que reciben cada uno de los micrófonos y las cámaras repartidas se compraran las informaciones recibidas. El reconocimiento de los sujetos de dentro de la sala se puede hacer de varias maneras posibles, ya sea bien por la imagen o por la señal de voz captada, el sistema identificará al usuario. Después se pueden comparar información y cotejar si la voz y la imagen que se ha reconocido confluyen en la misma persona o si por el contrario no es así.

Localización de personas[editar]

Las cámaras y los micrófonos nos pueden dar la posición de los sujetos una vez reconocidos. Compartiendo la información de los dos sistemas de captación, se puede estimas la posición del sujeto en la sala, ya que mediante una serie de cálculos en el sistema acústico o por la posición relativa del sujeto en cada una de las cámaras repartidas por la sala, se puede llegar a estimar la situación del sujeto dentro de la sala.

Tecnologías de seguimiento[editar]

La sala es capaz de seguir a cada uno de los sujetos reconocidos. Estas tecnologías nos brindan la posibilidad de saber que sujeto es y que lugar ocupa dentro de la sala en cada instante de tiempo.

Las salas[editar]

Actualmente este tipo de salas están aun den desarrollo. Las tecnologías que se implantan están muy estudiadas, pero hacerlas confluir en un solo punto puede ser una tarea ardua y complicada. Bien es cierto que el mundo del ocio a plasmado bien la idea en una serie de videojuegos, donde se incorpora al usuario dentro de un entorno para interactuar directamente, sin necesidad de mando.

Actualmente en la Universidad Politécnica de Cataluña hay una Smart Room, que se está desarrollando por un equipo de investigadores. La sala cuenta con todas las tecnologías anteriormente descritas y se hace investigación. Es una pequeña sala que está preparada para dar cabida a 5 sujetos dentro de ella. Es un claro ejemplo de como estás tecnologías pueden llevar se a cabo y pueden convivir.