Enseñando a las máquinas a escuchar y hablar

23 febrero 2011 | 14:37

Cuando a mediados de 2004 me entrevistaron por primera vez para entrar a trabajar en Google, el concepto de movilidad recién estaba comenzando a asomar en el radar de la compañía. Mi pasión era la tecnología de reconocimiento de voz, un campo en el que ya hacía 20 años que venía trabajando. Después de una década de investigación en SRI, seguida por 10 años ayudando a construir Nuance Communications, la compañía de la que fui co-fundador en 1994, estaba listo para un nuevo desafío. Consideraba que movilidad era un área con mucho potencial para la innovación, con una necesidad clara de tecnología de reconocimiento de voz y destinada a ser una plataforma clave para la entrega de servicios.

Durante la entrevista, comenté mi interés por incursionar en el espacio móvil y mencioné que en caso de que Google no tuviera planes en este sentido, yo probablemente no era la persona indicada para que me contratasen. Bueno, me dieron el trabajo y, al poco tiempo, ingresé en la compañía, sin un equipo y sin siquiera un rol definido. Como es característico de Google, me alentaron a que explorara la compañía, echara un vistazo a lo que los diferentes equipos estaban haciendo y descubriera qué era lo que hacía falta hacer.

Después de unos pocos meses, le propuse al equipo directivo la idea de desarrollar un teléfono con una interfaz de reconocimiento de voz para realizar búsquedas locales. A pesar de que en esa reunión hubo diferencias de opinión acerca de cuál aplicación haría más sentido para Google, todos estuvieron de acuerdo en que yo debía comenzar a armar un equipo enfocado en tecnología de reconocimiento de voz. Con la ayuda de algunos colegas, que también tenían experiencia en el campo, comencé a contratar gente y, en unos pocos meses, ya había un equipo trabajando sin descanso en nuestro propio sistema de reconocimiento de voz.

Seis años después, me alegra ver cuán lejos hemos llegado y cómo se han expandido nuestros objetivos a largo plazo. Cuando comencé, tuve que esforzarme por venderles a otros equipos la idea de que la tecnología de reconocimiento de voz tenía un claro valor para la misión general de Google. Ahora, todo el tiempo se me acerca gente de otros equipos con ideas y necesidades relacionadas con esta tecnología. El desafío más grande es escalar nuestro esfuerzo para sacar provecho de las oportunidades. Hemos avanzado desde GOOG-411, nuestro primer dispositivo activado con la voz, hasta Voice Search, Voice Input, Voice Actions, una Voice API para desarrolladores de Android, subtitulado automático para los videos de YouTube, transcripción automática de mensajes de voz para Google Voice y traducción voz a voz, entre otros. Solamente en el ultimo año, hemos llevado nuestra tecnología a más de 20 idiomas.



La tecnología de reconocimiento de voz requiere una enorme cantidad de datos para alimentar nuestros modelos estadísticos y mucho poder computacional para entrenar a nuestros sistemas, y Google es el lugar ideal para incursionar en estos enfoques tecnológicos. Con grandes cantidades de datos, poder computacional y una infraestructura enfocada en soportar servicios a gran escala, tenemos la base necesaria para lanzar rápidamente y salir con nuevas versiones basándonos en retroalimentación en tiempo real.

He estado explorando tecnología de voz por casi tres décadas, pero aún sigo viendo un enorme potencial para innovar. Nos imaginamos una exhaustiva interfaz para comunicaciones de voz y de texto que desafíe todas las barreras de modalidad e idioma y haga que la información esté realmente accesible de forma universal. Y creo que en Google tenemos la major oportunidad para convertir a este futuro en una realidad.


Por by Mike Cohen, Manager, Tecnología de Reconocimiento de Voz

Google Apps for Business para miles de estudiantes de la Institución Educativa Anhanguera de Brasil

| 11:25

Labels: ,

Anhanguera Educacional eligió Google Apps for Business para hacer más dinámica la comunicación y la colaboración entre sus 310 mil estudiantes, personal administrativo y profesores. De esta forma, también ayudará a que sus alumnos y docentes estén mejor preparados para aplicar su conocimiento en plataformas innovadoras como Google Apps y aplicarlo a situaciones del mundo real.

Anhanguera es la red educativa privada más grande de América Latina en términos de cantidad de estudiantes y de valor de mercado. Ofrece cursos universitarios, de post grado y de extensión universitaria. Cuenta con más de 54 campus y con 500 centros de educación a distancia.

La implementación de la plataforma de Google ofrecerá diversos beneficios. La solución estimulará el auto-aprendizaje, la colaboración y el intercambio de experiencias y conocimiento, sin el costo y la complejidad del mantenimiento y actualización de hardware y software. En la práctica Google Apps permitirá a alumnos y profesores, por ejemplo, tener una cuenta de email, crear sitios web donde podrán alojar y compartir contenidos como trabajos prácticos, exámenes, noticias, textos complementarios, videos, etc. Además podrán acceder a herramientas de de comunicación instantánea, crear grupos y comunidades en base a intereses o asistir a clases a través de la web e incluso a través de dispositivos móviles. Otro beneficio directo es que todos los participantes tendrán acceso al calendario de la institución para estar al tanto de las fechas de las actividades, exámenes, notas y matriculación.

Google Apps for Business ofrece capacidad de almacenamiento 50 veces superior a la media, que es de 25 GB para cada cuenta de correo electrónico. Por otra parte, la solución puede utilizarse en cualquier lugar, utilizando varios dispositivos - desde teléfonos inteligentes hasta notebooks y tablets - ya que los datos se alojan en la nube.

“Con Google, queremos incorporar nuevos conceptos al proceso educativo y despegarnos de algunos paradigmas que ya están muy gastados. Uno de los nuevos paradigmas con más relevancia ahora se relaciona con transformar el rol del profesor, quien deja de ser actor principal y adopta la posición de alguien que estimula y guía, mientras que el estudiante, en vez de ser un receptor pasivo, se convierte en una participante activo de su propio proceso de aprendizaje. Google Apps nos ayudará a estimular el aprendizaje interactivo, la colaboración y la movilidad; al mismo tiempo que convierte a la relación entre estudiantes y profesores en una estructura menos jerárquica” -- Ana María Costa, Vicepresidente Académica de Anhanguera Educacional.

Hoy en día ya son más de 10 millones los estudiantes de todo el mundo que usan Google Apps en instituciones como Brown University, Northwestern University, University of Southern California, Arizona State University, University of Notre Dame, entre otras.

Sin dudas, el ritmo de crecimiento del “cloud computing” es acelerado e irresistible, y creemos que está transformando la manera no sólo de hacer negocios, sino también de aprender y relacionarse. Para más información sobre lo que otros clientes piensan acerca de implementar Google Apps for Business como plataforma de negocios, ir aquí.


Por Antonio Luiz Schuch, Director de Google Enterprise, América Latina.

Los resultados en Google, cada vez más sociales

17 febrero 2011 | 14:39

Hoy estamos dando otro paso para llevarles a los usuarios todas las ventajas de Google más las opiniones de las personas que a uno le interesan. Como siempre, queremos ayudarlos a encontrar las respuestas más relevantes entre los miles de millones de páginas interconectadas en Internet. Pero sabemos que la relevancia no se limita solo a páginas web: se trata también de relaciones. Es por eso que en 2009 presentamos Google Social Search, producto al que, desde entonces, le hemos hecho muchas mejoras. Ahora hemos avanzado un poco más y estamos dando a los usuarios las herramientas para que puedan acceder a más información sobre las personas que les interesan cuando éstas publican en YouTube, Flickr o su propio blog o sitio web.

Primero, los resultados de búsqueda social o social search estarán ahora mezclados con los otros resultados, de acuerdo por supuesto con su relevancia. Antes, estos resultados solo aparecían al pié de página. Esto significa que los usuarios empezarán a ver más contenido de amigos y compañeros de trabajo, con anotaciones bajo los resultados que han compartido o creado. Por ejemplo, si uno está pensando en ir y escalar el Aconcagua y un colega de la oficina escribió un blog contando su experiencia al respecto, Google mostrará ese post con una nota y una foto:

Los resultados sociales pueden aparecer ahora en cualquier lugar de la página. También hemos refinado la interfaz.

Segundo, hemos hecho que Social Search sea más exhaustiva: ahora agregamos notas para links que la gente ha compartido en Twitter y otros sitios. Anteriormente, mostrábamos resultados que la gente había creado y vinculado a través de sus perfiles de Google. Ahora, si alguien con quien el usuario está conectado comparte de manera pública un link, seguramente mostraremos ese link en los resultados con una anotación clara. Por ejemplo, si estoy buscando el video de cuando el presidente de EE.UU. apareció en el Daily Show y un amigo mío lo había subido a Twitter, el resultado probablemente sea promovido y veré una nota con la foto de mi amigo:

Ahora Social Search incluye links que la gente comparte en Twitter y otros servicios.

Tercero, hemos dado más control a los usuarios sobre cómo conectar cuentas, y hemos hecho que el proceso de conectar cuentas sea más conveniente. Todavía es posible conectar cuentas públicamente en el Perfil de Google, pero ahora añadimos una nueva opción para conectar cuentas de forma privada a través de la cuenta de Google. (Después de todo, a lo mejor uno no quiere que todos los que lo conocen sepan que en Twitter es @fanáticodebobesponja).

Adicionalmente, si nuestros algoritmos encuentran una cuenta pública que puede ser la de un determinado usuario (porque por ejemplo tiene los mismos nombres de usuario), podemos invitar a ese usuario a que conecte sus cuentas directamente en la página de resultados y en los settings de su Cuenta de Google:

Agregamos la opción de elegir si mostrar o no públicamente en el Perfil de Google las cuentas conectadas

Para una visión general de Google Social Search y nuestras nuevas opciones, mirar este video explicativo:



Como siempre, los usuarios podrán obtener resultados sociales de búsqueda solo cuando estén conectados a su Cuenta de Google. Estos cambios comienzan a implementarse hoy en Google.com, pero por ahora solamente en idioma inglés. Los usuarios podrán empezar a experimentar los cambios en los próximos días. Nuestro objetivo general es que todos encuentren la información más relevante posible, personalizada según sus intereses y la gente que más le importa. Para más información, ir a nuestro centro de ayuda.

Por Mike Cassidy, Director de Gestión de Producto, y Matthew Kulick, Gerente de Producto

Nueva herramienta para que los editores online gestionen el acceso a su contenido

16 febrero 2011 | 17:47

El CEO de Google, Eric Schmidt, anunció en la Universidad de Humboldt en Berlin el lanzamiento de Google One Pass, un servicio que permite a quienes publican online definir sus propios precios y términos para el acceso a su contenido digital. Con Google One Pass, los editores online pueden establecer una relación directa con sus clientes y brindarles a los lectores acceso a contenido digital a través de distintas páginas web y aplicaciones móviles.

Los lectores que compren contenido a un editor que use One Pass pueden acceder al contenido en tablets, smartphones y sitios web utilizando un single sign-on (SSO) para loguearse, con email y contraseña. Muy importante, este servicio permite a los editores autenticar suscriptores para que los lectores no deban volver a suscribirse si quieren acceder al contenido desde otro dispositivo.

Con Google One Pass, los editores pueden definir cuándo y cómo van a cobrar el contenido, y pueden experimentar con diferentes modelos para decidir cual les conviene más: ofrecer suscripciones, dar acceso con medidor, ofrecer contenido"freemium" o incluso vender artículos específicos desde sus páginas web o aplicaciones móviles. Este servicio también les permite a los editores online ofrecerles a sus sucriptores existentes del producto en papel acceso gratuito (o con descuento) al contenido digital. Google se encarga del resto, incluyendo la tecnología de pago operada a través de Google Checkout.

Nuestro objetivo es brindar una plataforma abierta y flexible que refuerce nuestro compromiso de apoyar a los editores, al periodismos y al acceso a contenido de calidad. Tal como First Click Free, Fast Flip y Living Stories, esta es otra iniciativa desarrollada para facilitar a los editores la promoción y distribución de su contenido digital.

Las empresas que publican online de Alemania Axel Springer AG, Focus Online (Tomorrow Focus) y Stern.de estuvieron junto a Eric Schmidt en la Universidad y se presentaron como nuestros primeros socios de Google One Pass. Otros socios ya se han sumado a la iniciativa, como Media General, NouvelObs, Popular Science, Prisa y Rust Communications.

Google One Pass está actualmente disponible para editores en Canadá, Francia, Alemania, Italia, España, el Reino Unido y los Estados Unidos. Quienes publiquen contenido online en esos países y deseen conocer más detalles, pueden contactarse con el equipo de Google One Pass o completar una forma con su información en nuestro website. También nos gustaría escuchar la opinión de editores en otros países ya que estamos planeando expandirnos a más lugares en los próximos meses.

Por Lee Shirani, director de gestión de negocio de producto, Google Commerce

Chile Utiliza YouTube para Transparentar Actos de Gobierno

| 15:00

Con el objetivo de incrementar la transparencia de los actos públicos, el gobierno de Chile ha realizado una serie de presentaciones en las cuales el presidente Sebastián Piñera y sus 22 ministros hablaron sobre su gestión y los objetivos alcanzados en el año 2010 así como expectativas para el año en curso.


Todas estas presentaciones fueron realizadas entre el 20 de Diciembre de 2010 y el 13 de Enero de 2011 en el palacio de La Moneda y se pueden visualizar en YouTube.com/LaMoneda así como en el sitio oficial del gobierno de Chile.

Esta es la primera vez que una iniciativa con este nivel de participación pública ha sido llevada adelante en Chile. Cada presentación contó con una audiencia de funcionarios, medios de comunicación, organizaciones sociales y líderes de opinión.

Los videos fueron subidos al canal oficial de YouTube del gobierno de Chile donde pueden ser visualizados y comentados por una audiencia global. Estas herramientas permitieron maximizar el alcance de los mensajes de gobierno y darle mayor transparencia a la gestión pública.


Por: Pedro Less Andrade, Gerente de Políticas Públicas y Asuntos Gubernamentales, Google Inc., América latina

Heavy Metal o los Pensamientos de Peter sobre la Inteligencia Artificial

15 febrero 2011 | 13:52

Labels:

Mientras que la computadora Watson compite con personas en el popular programa de TV de EE.UU. "Jeopardy!", el director de investigación de Google, Peter Norvig, explica hasta dónde hemos llegado construyendo máquinas inteligentes.

Hace cuatro décadas, el ex presidente de los Estados Unidos Richard Nixon declaró la guerra contra el cáncer y prometió “un compromiso total a nivel nacional” para combatir la enfermedad. Medio siglo atrás, el ex presidente John Kennedy prometió liderar la carrera espacial y hacer que el hombre llegara sano y salvo a la luna antes de que terminara la década del 60. Y hace 54 años, el pionero de la Inteligencia Artificial (I.A.), Herbert Simon, declaró: “en este momento existen en el mundo máquinas que piensan" y predijo que en un década, una computadora sería campeona de ajedrez.

¿Cómo les fue a estos ambiciosos proyectos? Todos sabemos que Neil Armstrong dio ese salto gigante para la humanidad en 1969, antes de terminar la década, tal como había prometido Kennedy. Para mediados de los años ’70, ver a astronautas caminando o conduciendo vehículos en la luna se volvió tan rutinario que los televidentes comenzaron a cambiar de canal con impaciencia para seguir mirando sus partidos de baseball. Sin embargo, para el hombre común, pareciera que los esfuerzos por curar el cáncer o dominar la inteligencia artificial han fracasado, ya que no han habido momentos clave en los que se descubriera la cura o se hallara la respuesta.

Sin embargo, la verdad es más compleja. Por un lado, el programa Apolo fue un éxito espectacular, pero también marcó el final de un progreso: ningún ser humano ha viajado a más de 640 Kilometros del planeta Tierra desde 1975. Mientras tanto, la guerra contra el cáncer ha progresado de manera continua. En los últimos 20 años, las muertes por esa enfermedad han disminuido 21% en hombres y 12% en mujeres, debido a una combinación de mejores diagnósticos, de la baja en el hábito de fumar y de tratamientos específicos para docenas de diferentes tipos de cáncer, particularmente linfoma, leucemia y cancer de testículos. Quienes anhelaban una “cura” única se desilusionaron porque el cáncer resultó no ser un problema único, sino un complejo abanico de problemas interrelacionados sobre los que continuamos teniendo un progreso incremental.

La inteligencia artificial resultó ser un tema más parecido en este sentido a la investigación sobre el cáncer. No tenemos a HAL 9000, a C3PO, al Comandante Data, ni a ninguno de los otros androides imaginados en las películas, pero la tecnología de I.A. impacta a diario en nuestras vidas, contribuye a la economía en cientos de miles de millones de dólares al año y está progresando de manera continua. Todo esto aparece detrás de escenas en aplicaciones como:
  • Programas de filtrado de spam que usan técnicas de aprendizaje y corrección de la I.A. y logran identificar correctamente más de 99,9% de los dos mil millones de correos electrónicos spam que se envían cada día.
  • El smartphone Android puede reconocer la voz del usuario y transcribir lo que dice de manera bastante acertada, a pesar de los acentos locales y de ruidos que puede haber en la calle en ese momento, como bocinazos.
  • Los programas de ajedrez de I.A. juegan al mismo nivel que los campeones humanos (derrotaron al campeón mundial 40 años después de lo que había predicho Simon, no 10). La computadora Watson, de IBM, competirá desde el 14 al 16 de febrero contra los campeones del popular programa televisivo de preguntas y respuestas "Jeopardy!". En el terreno del juego de damas, la I.A. ha llegado a la perfección y ha permitido comprobar por primera vez que si ambos contendientes juegan correctamente, el juego de damas siempre termina en empate.
  • Con el sistema de traducción de Google, si el usuario escribe (o dice en voz alta) una oración en uno de entre 58 idiomas, verá (o escuchará) la traducción al idioma que elija. Las técnicas de aprendizaje automatizado que se usan en este proyecto permiten que se agregue un nuevo idioma en dos semanas de trabajo, un tiempo que se convertiría en dos décadas si no se usaran técnicas de aprendizaje.
  • El Kinect de Microsoft puede reconocer el movimiento y los gestos tan correctamente que ya no hace falta un control para la consola de videojuegos.
  • Los vehículos prototipo de Google que se auto-conducen pueden recorrer 1.000 millas de autopistas ventosas y de calles de una ciudad sin que haga falta la intervención del conductor humano. Sin embargo, los autos autónomos no son nada nuevo; de hecho, vehículos sin conductores humanos se han estado utilizando en la última década en zonas de guerra, y los pilotos automáticos de las aerolíneas modernas son perfectamente capaces de volar un avión desde el despegue hasta el aterrizaje (aunque los pilotos humanos siempre prefieren hacer algo del trabajo). El progreso ha sido increíblemente acelerado: un sistema de I.A. de Stanford ha aprendido a volar un helicóptero inestable observando a un experto por solo unas pocas horas, y ahora puede desempeñarse mejor que la mayoría de los pilotos de helicóptero.
  • Los sistemas de I.A. aprueban transacciones con tarjetas de crédito, aplicaciones para compañías de seguro y gestiones de reclamos y de préstamos, a la vez que detectan fraudes y calculan riesgos. También encaminan miles de millones de llamadas telefónicas y de conexiones a Internet, aliviando congestiones de tráfico y detectando comportamientos sospechosos. Estos sistemas pueden operar en la bolsa de valores mejor que los humanos (aunque desafortunadamente todos descubrimos en 2008 que los estándares con los que se comparaban no eran lo suficientemente altos).


En el camino hacia estos logros, la comunidad de la I.A. aprendió varias lecciones sorprendentes.

Las cosas que considerábamos complicadas resultaron ser más fáciles de lo pensado. La investigación temprana en I.A. se concentró en lo que parecían ser actividades intelectuales complicadas, como jugar ajedrez a nivel de gran maestro o probar teoremas en cálculo integral. Pero resultó ser que estos ejemplos de pensamiento lógico no son en realidad tan complicados de duplicar para una computadora, solo hace falta un puñado de reglas bien definidas y mucho poder computacional. En contraste, tareas que al principio creíamos que serían fáciles, resultaron ser complicadas. Un niño pequeño (o un perro) puede distinguir cientos de objetos (pelota, biberón, manta, madre, etc.) con solo mirarlos, pero resultó ser muy complicado construir un sistema de visión computacional que se desempeñara a ese nivel.

Lidiar con la incertidumbre resultó ser más importante que pensar con precisión lógica. Cuando pensamos en una solución inteligente para un problema lo hacemos como un proceso que contiene una serie de pensamientos lógicos irrefutables, y nos sorprendemos cuando alguien llega a esa secuencia. Pero eso es exactamente lo que le resulta fácil hacer a una computadora. Lo difícil para las computadoras es lidiar con la incertidumbre y elegir una buena respuesta entre muchas posibilidades. A finales de la década del 80, las herramientas fundamentales de la I.A. pasaron de la Lógica a la Probabilidad, y detrás de muchos de los avances recientes están los progresos fundamentales en la teoría del razonamiento incierto.

Aprender resultó ser más importante que saber. En los ’60 y los ’70, los programas de I.A. se conocían como "Sistemas Expertos", porque eran desarrollados en base a entrevistas con expertos en el campo (por ejemplo, se entrevistaban a médicos expertos para construir un sistema de I.A. en medicina), se codificaba el conocimiento y se lo transformaba en reglas lógicas que podían ser seguidas por una computadora. Este enfoque resultó, por muchas razones, ser frágil. En primer lugar, la oferta de expertos es escasa y entrevistarlos consume mucho tiempo. En segundo lugar, muchas veces son expertos en lo que hacen, pero no lo son en explicar cómo lo hacen. Por último, los sistemas resultantes a menudo eran incapaces de manejar situaciones que iban más allá de lo que se había anticipado en el momento de las entrevistas.

Los sistemas actuales, por lo general, construyen basándose en ejemplos, en vez de hacerlo en reglas lógicas. O sea, no se trata de decirle a la computadora cómo un experto solucionó un problema, sino que se trata de darle muchos ejemplos de cómo han sido los problemas en el pasado: las características que describen la situación inicial, una descripción de la solución que se aplicó y una calificación que indique cómo funcionó esa solución. Basándose en eso, el algoritmo de la computadora puede aprender qué hacer en determinada situación (y a veces incluso en situaciones que no son similares). Este cambio de enfoque es importante porque es más robusto y porque en el mundo online es a menudo mucho más fácil reunir gran cantidad de ejemplos que entrevistar a un experto.

El foco se trasladó de reemplazar humanos a aumentarlos. Otra implicancia de la frase "Sistema Experto" es que éste reemplaza a un experto con una sistema de computadora. Este enfoque hacía sentido en los años ’70, cuando las computadoras eran un objeto raro y costoso y las inversiones en tecnología computacional se destinaban a un número limitado de aplicaciones con alto retorno. Pero hoy las computadoras están en todos lados y tiene más sentido pensar en aumentar el desempeño de un humano (ya sea experto o no) en vez de intentar reemplazar al humano. Esto significa que tanto los humanos como las computadoras pueden concentrarse en hacer lo que hacen mejor. Un buen ejemplo es el motor de búsqueda online, que usa I.A. (y otra tecnología) para elegir entre miles de millones de páginas web y entregarle al usuario las páginas más relevantes de acuerdo con su consulta. Lo hace mucho mejor y mucho más rápido que lo que podría hacerlo un humano. Pero el motor de búsqueda todavía depende de un humano para tomar la decisión final: en qué link hacer clic y cómo interpretar la página resultante.

La asociación entre humano y máquina es más fuerte que lo que ellos serían por sí mismos. Como dijo Werner von Braun cuando le preguntaron qué tipo de computadora habría que poner en futuras misiones espaciales, "el hombre es la mejor computadora que podemos poner a bordo de una nave espacial, y el único que puede ser producido en masa sin necesidad de mano de obra barata". No hay necesidad de reemplazar a los humanos; de hecho, deberíamos pensar qué herramientas les permitirán ser más productivos.

Para ver cómo se han aprendido estas lecciones, tomemos el ejemplo de la traducción automatizada de un lenguaje a otro (digamos de inglés a chino). En la década del 60, el lingüista Noah Chomsky recalcó correctamente que hay un número infinito de frases que se usan en el idioma inglés, por ejemplo "big deal" (asunto importante), "really big deal" (un asunto realmente importante), "really, really big deal" (un asunto realmente muy, muy importante) y se puede seguir. Por lo tanto, el lenguaje no podía describirse como una lista finita de ejemplos, solo podía describirse como un conjunto de reglas, lo que se denomina gramática. Durante las siguientes dos décadas, se enfocó en tratar de articular esas reglas, pero la búsqueda no resultó muy fructífera. El idioma es algo muy vago, muy dependiente del contexto y muy creativo como para ser capturado en un grupo definitivo de reglas que delimiten lo gramatical de lo no gramatical.

Alrededor de 1991, investigadores de IBM resucitaron una iniciativa que había sido propuesta por primera vez en 1949: tratar a la traducción de la misma manera en que los criptógrafos descifraron códigos secretos durante la Segunda Guerra Mundial, o sea, contando las frecuencias de letras y palabras y buscando los patrones. Este enfoque, por supuesto, simplifica demasiado la grandeza del idioma y está condenado a ser un modelo teórico incompleto. Sin embargo, sí es un buen modelo práctico. Con las computadoras primitivas de 1949 era totalmente poco práctico, pero con el poder computacional moderno y la riqueza de ejemplos idiomáticos disponibles en Internet, ha resultado ser la mejor técnica disponible.

Así es cómo funciona: primero se recolectan ejemplos de un texto traducido. Por ejemplo, se toma un folleto explicando las características de un producto que contiene la frase en inglés "Installation: Additional instructions and troubleshooting assistance" bajo el título "English" y la frase "Instalación: Instrucciones adicionales y asistencia para problemas más frecuentes" bajo el título "Español". Entonces se recolectan milllones de pares de frases como esas, y si luego alguien pide traducir exactamente una frase que se ha visto antes, la computadora solo debe buscarla. Debido a que hay millones de frases conocidas, esto ocurrirá un buen porcentaje de las veces.

Sin embargo, siempre habrá frases nuevas que no hemos visto antes. Para esas frases, deberemos reacomodar partes que ya habíamos visto en diferentes frases.

Por ejemplo, cuando se pide traducir del inglés al español "I need additional instructions", la computadora debería reconocer que habíamos visto antes la frase "additional instructions" y que corresponde a "instrucciones adicionales". También debería reconocer que había visto "I need" en otros pares de frases y que se traduce como "Necesito” y a veces como “Yo necesito".

Todo el proceso se basa en estadísticas, en la cantidad de ejemplos que hemos visto. No hay reglas gramaticales explícitas, pero el sistema implementa de todas maneras el juicio de valor gramatical que aplicaron los que crearon los ejemplos en su lengua materna.

Este enfoque puede parecer simplista, ya que lo único que hace es contar cuán a menudo varias combinaciones de palabras han sido vistas anteriormente. Por supuesto, en un sistema real hay varios agregados a este simple esquema, pero el hecho es que básicamente se apoya en contar ejemplos. La clave está en que llegado determinado punto, el número puro de ejemplos atraviesa un umbral y el sistema pasa de funcionar de manera poco aceptable a hacerlo de forma bastante competente. Esto se relaciona con el modo en que un niño aprende un idioma. En ambos casos, se trata de un proceso de aprendizaje, aunque es cierto que el cerebro humano es diferente a la memoria de una computadora en medidas que aún no podemos entender completamente, por lo tanto la analogía no es del todo exacta. De todas maneras, es admirable que el equipo de ingenieros de Google haya sido capaz de desarrollar un sistema de traducción que administra 58 idiomas, a pesar de que muchos de esos idiomas no son hablados por nadie del equipo.

Este enfoque de basarse en ejemplos —en cantidades masivas de datos— en vez de hacerlo en reglas ingeniosamente compuestas, es un tema recurrente en el trabajo actual en el campo de la I.A. Ha sido aplicado a problemas que se relacionan estrechamente, como reconocimento de la voz, y a problemas totalmente diferentes, como la navegación robótica. El sistema de la computadora Watson de IBM también se apoya en volúmenes masivos de datos, repartidos en cientos de computadoras, y en un sofisticado mecanismo para combinar evidencia que proviene de distintas fuentes.

Esta década marca un momento muy promisorio para el desarrollo en el campo de la I.A. porque la economía del hardware ha hecho posible recientemente que se puedan resolver muchos problemas que hubiera sido excesivamente costoso resolver en el pasado. Adicionalmente, el desarrollo de redes de datos inalámbricas y celulares significa que estas nuevas aplicaciones no están confinadas al laboratorio de investigación, sino que están disponibles para mucha gente como servicios en Internet. Ahora se puede usar el teléfono para traducir en tiempo real la palabra hablada y mantener una conversación que hubiera sido imposible mantener en el pasado. Vamos a continuar viendo en el futuro cercano cómo aplicaciones aún más poderosas e inteligentes del poder computacional pasan a estar disponibles para el público en general.

Pero, ¿hacia dónde va todo esto? ¿Vamos a llegar a un momento en que las computadores realmente sean capaces de pensar? La mayoría de los científicos en computación dirían que la pregunta está mal formulada, y que cualquiera sea la respuesta que se dé, no significaría mucho. Después de todo, los que hablan en español, por ejemplo, coinciden en que "los aviones vuelan", usando un verbo que anteriormente estaba reservado solamente para las aves, no para las máquinas, y por lo general están de acuerdo en que los "submarinos no nadan". Pero estos son datos que tienen que ver con el uso del lenguaje, no con ingeniería aeronaútica o de submarinos. (De hecho, quienes hablan en ruso dirían que los submarinos sí nadan). El punto es que las capacidades de las computadoras van a mejorar y los humanos vamos a encontrar nuevos modos de relacionarnos con ellas: serán herramientas, consejeras, trabajadoras, mascotas, compañeras, entre otros roles. Pero las palabras que usamos para describir lo que las máquinas hacen, incluyendo si usamos o no el verbo "pensar", tiene más que ver con cómo nos vemos a nosotros mismos que con las capacidades de las máquinas.

Peter Norvig es director de investigación en Google y autor de numerosos libros sobre Inteligencia Artificial.

Google ayuda a las empresas a triunfar en la era de la movilidad

14 febrero 2011 | 20:15

Para finales de 2011, se estima que mil millones de personas alrededor del mundo estarán conectadas a Internet móvil, y 50 por ciento de los estadounidenses tendrán un teléfono inteligente. Debido a la explosión de dispositivos móviles con acceso a Internet, el uso de la tecnología móvil está creciendo exponencialmente: el número de búsquedas realizadas a través de smartphones y tablets se ha cuadriplicado durante el último año, mientras que cada vez más usuarios descargan aplicaciones móviles -de hecho, se juega el equivalente a 125 años por día con la popular aplicación Angry Bird-.

Todo indica que, para la mayoría de la gente, ya ha comenzado lo que podríamos denominar la era de la movilidad.

Sin embargo, algunas empresas y organizaciones todavía no han terminado de adaptar sus estrategias online para estar al día con las nuevas tendencias, y aún deben migrar sus actividades de publicidad, diseño de páginas web y comercio electrónico hacia plataformas móviles. La oportunidad que se les abre es inmensa, y quisiéramos que todos formaran parte del mundo móvil.

Actualmente, los anunciantes que adoptan plataformas móviles están viendo crecer el reconocimiento de sus marcas, los índices de intención de compra y el volumen de ventas generadas gracias a efectivas campañas de search y de display móviles. Los desarrolladores móviles y quienes publican online están sosteniendo negocios muy rentables con ingresos generados por la publicidad. Además, los consumidores se benefician de avisos útiles y relevantes, a los que pueden acceder desde dispositivos móviles.

Para ayudar a las compañías a sacar el mejor provecho de las oportunidades que la publicidad móvil representa, Google se está enfocando en tres principios fundamentales sobre los que gira nuestro negocio de los avisos móviles:

  • Integración: Estamos llevando las mejores características de la publicidad online hacia dispositivos móviles. Queremos ayudar a anunciantes y desarrolladores a que extiendan los beneficios de la publicidad que hacen apuntando a computadoras de escritorio para llegar también a usuarios móviles, al mismo tiempo que administran de manera integrada sus campañas y sus espacios publicitarios a través de diferentes canales y plataformas.
  • Inclusión: Está bien claro que el concepto de movilidad va mucho más allá de un solo dispositivo, un solo formato de aviso o un único estilo de campaña publicitaria. Nuestra soluciones de publicidad abarcan distintas opciones de search, texto, display, video, comercio electrónico y más, sobre una gran variedad de dispositivos. Esto permite que las empresas y los consumidores se conecten de nuevas maneras, más útiles y relevantes.

  • Soluciones específicas para dispositivos móviles: Los dispositivos móviles tienen características únicas, como GPS incorporado y pantallas táctiles (sin olvidarnos de la capacidad de realizar llamadas telefónicas) que facilitan que la gente se relacione de manera conveniente con la información, lo que al mismo tiempo crea oportunidades únicas para los negocios. Nuestras soluciones de publicidad están desarrolladas para que los desarrolladores, anunciantes y quienes publican online, saquen provecho de estas características específicas de la movilidad.


El poder de la conectividad constante propiciado por la movilidad es una nueva realidad llena de oportunidades que ya ha cambiado el modo en que la gente se relaciona con la información, con las empresas y unos con otros. Estamos recién en los comienzos de la revolución móvil, y hay mucho más por venir.

Por Karim Temsamani, Líder Global de Movilidad

Ahora se puede hacer check-in con Google Latitude

02 febrero 2011 | 21:19

Labels: ,

Cuando presentamos Google Latitude, lo hicimos con el objetivo de facilitar que los usuarios compartieran con amigos y familiares el lugar dónde se encontraban. Para los 10 millones de personas que usan de forma activa Latitude cada mes, ese lugar en el que están significa un punto en el mapa. A partir de ahora, en Google Maps 5.1 para Android, también se puede conectar esa ubicación con un lugar real si uno realiza check-in usando Latitude.

Cómo conectar la ubicación con lugares reales
Claro que sigue siendo posible usar Latitude para actualizar y compartir de manera automática la ubicación, pero si uno realiza un check-in puede añadir contexto a esa ubicación. Por ejemplo, yo vivo en San Francisco pero viajo a menudo a diferentes países. Hasta ahora, cuando compartía mi ubicación, estaba avisándoles a mis amigos y familiares si estaba en la otra punta del planeta o en mi barrio. Ahora, la opción de hacer check-in ,les permite ver además si estoy comiendo en un restaurant en Taipei o decidir si se encuentran conmigo para compartir un café en el bar cercano.


Vean en un mapa dónde están sus amigos y dónde están haciendo check-in.

Este no es el check-in típico
Debido a que la gente puede usar Latitude para que detecte automáticamente su ubicación, hemos agregado algunas opciones para que el proceso de check-in sea aún más fácil:
  • Notificaciones: Se puede activar la opción de notificaciones de check-in en Latitude y recibir una notificación para hacer check-in en un lugar cercano cuando uno llega. No hay que olvidarse de hacer check-in de nuevo. 
  • Check-ins automáticos: Se puede elegir hacer check-in de manera automática en lugares específicos que el usuario designa, de modo que el sistema realice el check-in automáticamente cuando uno llega allí. 
  • Check out: Una vez que uno se va del lugar, Latitude realiza el check-out de manera automática , para que los contactos sepan que uno ya se fue. 



Explorar el mundo check-in a check-in

Latitude fue desarrollado dentro de Google Maps para Android, de modo que la opción de hacer check-in funciona eficientemente a través de Latitude y de Maps. Por ejemplo, si uno hace check-in en ese lugar de hamburguesas que tanto le gusta, puede ver la página de Place (Lugar) con críticas y comentarios sobre el lugar, lo que puede ayudar a decidir qué ordenar. Cuando amigos hacen check-in en un lugar, uno puede ir directamente desde su perfil de Latitude hacia la página de Place para conseguir más información sobre ese lugar, usar Google Maps Navigation (Beta) para obtener indicaciones detalladas sobre cómo llegar allí, y más.

Uno también puede hacer check-in en su lugar favorito para ganar estatus especial allí; o sea que uno podrá ver en su página de Place si es un “Habitué”, un “VIP” o un “Gurú”. Uno debe continuar realizando check-in allí para mantener su estatus o alcanzar el siguiente nivel.


Los check-ins de Latitude están construidos directamente sobre Google Maps y páginas de Place.

Por supuesto, hemos estado pensando cuidadosamente cómo hacer para que el proceso de realizar check-in en lugares fuera rápido y fácil, al mismo tiempo que le damos al usuario control sobre su privacidad. Tal cmo ocurre con la opción de compartir la ubicación en Latitude, hacer check-in es 100% opcional y uno puede elegir si quiere compartir esa información en Latitude, de manera pública en Internet y en su perfil de Google, o mantener esa información completamente privada.

Para más detalles de cómo administrar los check-ins con Latitude se puede visitar el Centro de Ayuda. En unos pocos días, el usuario podrá además ver su historial completa de check-ins usando la pestaña opcional de Historial en google.com/latitude desde la computadora.


Se puede optar por check-ins individuales o activar y desactivar notificaciones en los settings de Latitude.

Se puede empezar a hacer check-in descargando el ultimo Google Maps del Android Market (en Android 1.6+; seleccionar aquí si están con su teléfono) y después unirse a Latitude desde el menú principal. Si están usando la nueva Latitude app para iPhone, se pueden ver ahora los check-ins de los amigos y pronto haremos también posible la opción de hacer check-in desde ese dispositivo.



Esto es solo el comienzo...
Hacer check-in con Latitude es solo un paso para ayudar a los usuarios a conectar los lugares que frecuentan con la gente que les interesa. Creemos en que los usuarios deben tener la opción de usar o compartir su ubicación de la manera que gusten, y estamos trabajando para que la ubicación y los check-ins estén disponibles en más lugares a través de Google y de Internet.



Por Joe LaPenna, Ingeniero de Software, Equipo de Google Latitude

Presentación de la página web del Android Market

| 15:56

Labels: ,

En los últimos dos años, los desarrolladores de todo el mundo han ayudado a hacer de Android Market el lugar para encontrar más de 100.000 aplicaciones, juegos y widgets. Anteriormente, sólo podían acceder a Android Market, directamente en su dispositivo, pero hoy estamos gustosos de presentar el sitio web de Android Market http://market.android.com/ que te permite navegar y buscar aplicaciones de tu interés desde tu navegador web.


El nuevo sitio web de Android Market hace que sea fácil de descubrir nuevas aplicaciones por medio de una interfaz más grande y brillante. También puede enviar aplicaciones directamente a su dispositivo Android con unos pocos clics, sin necesidad de cables. Hemos construido en las nuevas funciones sociales, también. Puedes compartir aplicaciones con tus amigos a través de Twitter y puedes puede leer y escribir comentarios directamente a la aplicación de Android Market desde la web o desde tu dispositivo.

¿Y qué hay de todas esas aplicaciones que ya has comprado y descargado? Entra a la página web con tu cuenta de Google y da clic en "Mi Cuenta" para ver todas las aplicaciones que has comprado o descargado. De esta forma se hace la gestión de todas tus aplicaciones de una manera muy sencilla.

El mercado de la página web de Android se dio a conocer oficialmente hoy durante un acto en nuestras oficinas de Mountain View en el que mostramos Honeycomb (Android3.0), la versión más reciente de Android construido enfocándonos en las tabletas. Honeycomb tiene una interfaz de usuario completamente rediseñada, con más notificaciones y widgets interactivos, mejoramos el trabjao de tareas múltiples (multitaks), y por último trabajamos en mejorar los servicios de Google móvil optimizado para las tabletas. También mostramos de liberación pre optimizada de aplicaciones para Honeycomb, de más de 17 desarrolladores que incluyen:
  • AccuWeather
  • CNN
  • Disney Mobile
  • The Economist
  • Fuze cuadro de
  • Glu Mobile
  • Google Órgano de
  • Gobierno iQ
  • Intuit
  • Ngmoco
  • pulso Noticias
  • Quickoffice
  • la revista Time
  • TouchType
  • moda entretenimiento
  • Guerra tambor Estudios
  • Weatherbug
  • Zynga
Estén atentos para más en el Mobile World Congress (14 de febrero) en Barcelona, donde podrán encontrar a más de 50 desarrolladores haciendo demos de los últimos teléfonos y aplicaciones dentro del stand de Android en el pabellón 8.

Por: Eric Chu, Gerente del Programa de Plataformas Móviles 

Hotpot ahora es internacional

| 12:56

Labels: ,

En noviembre del año pasado, habíamos presentado Hotpot, un nuevo motor local de recomendaciones potenciado por los usuarios y su red de amigos. Usar Hotpot es simple: los usuarios califican lugares en google.com/hotpot —restaurantes, hoteles, etc.— y agregan a Hotpot amigos en cuyas opiniones confían. Entonces, la próxima vez que el usuario realice una búsqueda, Google le entregará resultados personalizados, listando lugares basándose en sus gustos y en las recomendaciones de su red de amigos.



Hemos visto cómo Hotpot fue creciendo y cambiando durante los últimos meses, y ahora ha dado un gran salto: estará disponible en las búsquedas tradicionales en Google y en muchos más idiomas.

Ahora se puede disfrutar de recomendaciones de Hotpot al realizar búsquedas en Google.com. Por ejemplo, si uno está buscando un restaurante en Lima, Perú, ingresa los términos “restaurante lima” en la caja de búsqueda de Google y, si un amigo ha calificado un restaurante en esa ciudad, es posible que se pueda ver la calificación otorgada y los comentarios, además del nombre y la foto, justo debajo de donde aparece listado el restaurante. Para ver todas las recomendaciones hechas por sus amigos, el usuario debe hacer clic en “Lugares” en el panel izquierdo de la página y elegir “Amigos solamente”. Para ver recomendaciones, es necesario estar logueado en una cuenta de Google.


La posibilidad de ver recomendaciones de lugares basadas en gustos personales, tanto del usuario como de su red de amigos, a través de más opciones de búsqueda en Google, harán que los resultados sean aún más relevantes. Quienes todavía no tengan amigos en Hotpot, pueden invitarlos a compartir recomendaciones sobre lugares usando la pestaña de “Amigos” en google.com/hotpot.

Pero Hotpot no sería tan divertido si no pudiera compartirse también con amigos en otras partes del planeta. Por lo tanto, a partir de ahora, Hotpot estará disponible en 38 idiomas adicionales, incluyendo chino, español, francés, alemán, italiano, coreano, polaco, portugués y ruso.

Ya se puede comenzar a calificar lugares y compartir recomendaciones con Hotspot en cualquier lugar, en cualquier momento, ya sea en google.com/hotpot, en Google Maps, usando Google Maps for Android con un sencillo widget, y en nuestra nueva iPhone app.

Por Lior Ron, Gerente de Producto

Bing usa resultados de búsqueda de Google y lo niega

| 12:50

Labels:

Muchos de ustedes habrán leído ya el reciente post de Danny Sullivan: “Google: Bing está haciendo trampa, está copiando nuestros resultados de búsqueda” y habrán escuchado la respuesta de Microsoft, ”Nosotros no copiamos resultados de Google”. Pero más allá de cómo cada una decida definir al verbo copiar, el punto de la cuestión es que estos resultados de Bing provienen directamente de Google.

Me gustaría brindar acá información de contexto y detalles sobre los experimentos que hemos realizados y que nos han llevado a comprender cómo Bing está usando resultados de Google.

Todo comenzó con tarsorrhaphy, que es una operación muy inusual de los párpados. A mediados de 2010, estábamos mirando los resultados de búsqueda de una consulta que había sido inusualmente mal escrita [torsorophy]. Google arrojó resultados con la palabra bien escrita: tarsorrhaphy. En ese momento, Bing no tenía resultados para la palabra mal escrita. Poco tiempo después, Bing comenzó a retornar nuestro primer resultado a sus usuarios sin ofrecer la corrección de la palabra (ver la imagen de pantalla más abajo). Eso era muy extraño. ¿Cómo era posible que retornaran nuestro primer resultado sin que la palabra estuviera bien escrita? Si hubieran sabido cómo se escribía correctamente, podrían haber retornado muchos más resultados relevantes para la consulta correcta.





Este ejemplo nos abrió los ojos, y en los meses siguientes fuimos notando que URLs de resultados de Google iban apareciendo cada vez con más frecuencia en Bing para todo tipo de consultas: consultas populares, consultas raras o inusuales y consultas mal escritas. Incluso comenzaron a aparecer en Bing resultados que nosotros considerábamos errores de nuestros algoritmos.

Nuestras sospechas crecieron a fines de octubre de 2010, cuando notamos un significativo incremento en la cantidad de veces que los resultados top de Google aparecían primeros en el ranking de Bing. Había un patrón estadístico demasiado llamativo como para ser ignorado. Para probar nuestra hipótesis, necesitábamos un experimento que determinara si Microsoft estaba realmente usando resultados de búsqueda de Google en el ranking de Bing.

Para realizar la prueba, creamos alrededor de 100 “consultas sintéticas”, o sea consultas que uno no esperaría que un usuario ingrese, como por ejemplo [hiybbprqag]. Como parte de un experimento de una sola vez, insertamos para cada consulta sintética un resultado top con una página web única (y existente) que no tenía nada que ver con la consulta ingresada. Abajo hay un ejemplo:




O sea, la consulta sintética no tenía ningún tipo de relación con el resultado que insertamos: la palabra inventada no aparecía en la página web y no había links en esa página que incluyeran esa consulta. En otras palabras, no había ninguna razón para que un motor de búsqueda retornara esa página web si uno ingresaba la consulta sintética. Como ejemplo, se podrían comparar las búsquedas sintéticas con los billetes marcados en un banco.

Les dimos a 20 de nuestros ingenieros laptops con Microsoft Windows recién instalado, corriendo Explorer 8 con la barra de herramientas de Bing incorporada. Como parte del proceso de instalación, elegimos la opción de IE8 de “Sitios Sugeridos”, y aceptamos las opciones por default de la barra de herramientas de Bing.

Les pedimos a los ingenieros que ingresaran las consultas sintéticas en la caja de búsqueda de la página de inicio de Google y que hicieran clic en los resultados (o sea los resultados que nosotros habíamos insertado). A las pocas semanas de haber comenzado este experimento, los resultados que insertamos comenzaron a aparecer en Bing. Abajo hay un ejemplo: una búsqueda de [hiybbprqag] en Bing retornó una página acerca de asientos en un teatro de Los Angeles. Hasta donde nosotros sabemos, la única conexión entre esa consulta y ese resultado es la página de resultados de Google (como se muestra en la imagen de pantalla de más arriba).



Notamos que esto ocurrió con múltiples consultas. Para la consulta [delhipublicschool40 chdjob] insertamos un resultado de búsqueda de una cooperativa de crédito:




La misma cooperativa de crédito apareció en Bing al ingresar la misma consulta:



Para la consulta [juegosdeben1ogrande] insertamos una página de joyas “bling”, las que usan los artistas de hip hop:



Y la misma página de joyas de hip hop apareció en Bing:



Tal como nosotros lo vemos, este experimento confirma la sospecha de que Bing está usando alguna combinación de:

Internet Explorer 8, que puede enviar datos a Microsoft a través de su opción de Sitios Sugeridos, y
la barra de herramientas de Bing, que puede enviar datos a través del Customer Experience Improvement Program (Programa de Mejora de la Experiencia del Cliente),

o posiblemente otros medios para enviar datos a Bing relacionados con lo que la gente busca en Google y los resultados de Google en los que hacen clic. Esos resultados de Google son más proclives entonces a aparecer en Bing. Para decirlo de otra manera, varios resultados de Bing se parecen cada vez más a una versión incompleta de los resultados de Google, como una imitación barata.

En Google creemos firmemente en la innovación y estamos orgullosos de la calidad de nuestros resultados de búsqueda. Hemos invertido considerablemente en el desarrollo de nuestros algoritmos de búsqueda porque queremos que nuestros usuarios obtengan la respuesta precisa cada vez que ingresen una consulta, y eso no es fácil. Nos interesa mucho competir de manera leal con nuevos algoritmos que sean genuinos, o sea algoritmos desarrollados a partir de innovación verdadera, y no que reciclen resultados de búsqueda de un competidor. Por lo tanto, aquellos usuarios que estén buscando los resultados más auténticos y relevantes, están invitados a recurrir directamente a Google. Y para aquellos que nos han preguntado qué es lo que queremos que resulte de todo esto, la respuesta es simple: nos gustaría que Bing abandonara esta práctica.

Por Amit Singhal, Google Fellow