Muito pouco, muito cedo… O Wehead ainda tem um longo caminho a percorrer antes de poder ser levado a sério, tanto em termos de hardware quanto de software.
Enquanto percorríamos o evento Showstoppers na CES, meus olhos pousaram em algo familiar. Fiz contato visual (da melhor maneira que pude para fazer contato visual com um par de olhos virtuais) com o Dispositivo Wehead de US$ 5.000, sobre o qual acabei de relatar apenas algumas semanas atrás. Ele estava sentado em uma mesa solitária no canto do enorme salão de baile onde o evento estava sendo realizado, com algumas pessoas basicamente reunindo coragem para falar com ele. Obviamente, eu queria realmente ter uma noção de como era conversar com uma IA, mas também ver se esse dispositivo de US$ 5.000 valia a pena. Para encurtar a história, o Wehead estava uma bagunça de cima a baixo. O hardware não tinha o tipo de sutileza que você esperaria de um produto premium, e o software falhou miseravelmente no processamento de solicitações em meio ao burburinho de todas as pessoas ao seu redor.
Designer: Nós vamos
O Wehead foi inicialmente concebido como um dispositivo de teleconferência único que poderia permitir que você falasse com pessoas por meio de aplicativos de bate-papo por vídeo, mas em vez de olhar para uma tela, você olha para uma cabeça que se moveu e respondeu ao ações da pessoa do outro lado da chamada. Em algum momento, a empresa fez a transição para transformá-lo em um assistente no estilo ChatGPT que usaria IA para responder a perguntas e aumentar a vida. A diferença entre o Wehead e algo como ChatGPT, Siri ou Google Assistant? O fato de Wehead realmente ter um rosto, o que, pelo menos em teoria, acrescentaria um aspecto mais imersivo e verossímil a toda a experiência.
O problema, contudo, residia em dois grandes domínios – em primeiro lugar, o Wehead era uma solução em busca de um problema. A falta de um componente facial na IA pode ser um problema, mas não é um problema que exija um robô biônico multitelas de US$ 5.000. Em segundo lugar, mesmo que isso fosse verdade, o próprio Wehead era um dispositivo mal montado, usando quatro telefones celulares, um microfone shotgun e um alto-falante para dar ao ChatGPT um toque antropomorfizado.
Para começar, apenas uma olhada no Wehead revelou o fato de que suas quatro telas eram na verdade smartphones montados em uma grande solução Macgyvered. O elemento da tela com os olhos do Wehead tinha, na verdade, um recorte visível da câmera frontal. Acima dele havia um microfone shotgun sem marca que capturava a entrada vocal e, abaixo, um pequeno alto-falante onde você esperaria que estivesse a garganta do Wehead. As quatro telas exibiam partes do rosto do Wehead, que emitiam emoções e respondiam ao Wehead falando, ouvindo e interagindo.
No entanto, embora o hardware parecesse ter sido montado por um grupo de estudantes de engenharia, o Wehead não conseguiu entregar. Seu rosto estava perpetuamente pixelizado, o que impactou o já minguante realismo do Wehead. Houve uma grande incompatibilidade entre o áudio e os movimentos do rosto, acrescentando mais problemas à mixagem… e, finalmente, o Wehead simplesmente não conseguia entender nada do que alguém dizia. Claro, o evento estava lotado, resultando em muito ruído de fundo, mas o Wehead ainda conseguiu falhar nas questões básicas que abordou. Quando Wehead ficou preso em um de seus ciclos de feedback “Sinto muito, não entendo”, alguém da empresa apareceu para fazer com que ele parasse de responder, mas foram necessárias três tentativas para fazer com que Wehead parasse. Muito pode ser atribuído à conversa de fundo do evento geral, mas isso praticamente levou a IA ao fracasso, mostrando sua clara falta de capacidade de isolar o áudio antes de processá-lo.
Mas o problema é o seguinte: acho que o Wehead tem um grande potencial. Só precisa de MUITO trabalho antes de justificar esse preço. Para começar, talvez troque as telas do smartphone por algo mais exclusivo, como um OLED curvo… e oculte o microfone e o alto-falante, para que não seja tão óbvio que isso foi montado usando hardware comprado na Best Buy. Um falante comandando o ChatGPT parece impressionante, mas a ilusão certamente desmorona quando parece um projeto de faculdade e quando o próprio Wehead mal consegue captar qualquer coisa que você diga.
*** Nota: Post com tradução Automática EN > PT
( pode conter alguns erros escrita ou leitura )
Para ver esta notícia em Inglês visite a nossa
versão internacional * www.revistalifestyle.com