Robot impara il Lip Sync guardando video umani

Un robot impara il lip sync realistico grazie all’IA, superando l’Uncanny Valley con movimenti facciali naturali. Una svolta nella robotica umanoide che rivoluziona comunicazione, espressività e interazione uomo‑macchina

Lip Sync robotico: la tecnologia che cambierà l’interazione uomo‑macchina.

Quasi metà della nostra attenzione durante una conversazione faccia a faccia è rivolta al movimento delle labbra. Eppure, i robot faticano ancora a muovere correttamente le loro labbra. Anche gli umanoidi più avanzati fanno poco più che gesti da “muppet” con la bocca – ammesso che abbiano un volto.

Noi esseri umani attribuiamo un’importanza enorme ai gesti facciali in generale, e al movimento delle labbra in particolare. Mentre possiamo perdonare un modo buffo di camminare o un movimento goffo della mano, rimaniamo inflessibili anche di fronte alla più lieve malgestualità del viso. Questo standard elevatissimo è noto come “Uncanny Valley”. I robot spesso sembrano privi di vita, persino inquietanti, perché le loro labbra non si muovono. Ma questo sta per cambiare.

Un team della Columbia Engineering ha annunciato di aver creato un robot che, per la prima volta, è in grado di apprendere i movimenti delle labbra per compiti come parlare e cantare. In un nuovo studio pubblicato su Science Robotics (1), i ricercatori dimostrano come il loro robot abbia utilizzato queste capacità per articolare parole in una varietà di lingue, e persino cantare una canzone tratta dal suo album di debutto generato dall’IA, “hello world”.

Il robot ha acquisito questa abilità attraverso l’apprendimento osservazionale anziché tramite regole. Ha prima imparato a usare i suoi 26 motori facciali osservando il proprio riflesso allo specchio, per poi imparare a imitare il movimento delle labbra umano guardando ore di video su YouTube.

«Più interagirà con gli esseri umani, meglio diventerà», ha promesso il dottor Hod Lipson (2), James and Sally Scapa Professor of Innovation nel Dipartimento di Ingegneria Meccanica e direttore del Creative Machines Lab della Columbia, dove è stato svolto il lavoro.

Il robot si osserva mentre parla

Raggiungere un movimento realistico delle labbra nei robot è difficile per due motivi: primo, richiede un hardware specializzato dotato di una pelle facciale flessibile azionata da numerosi minuscoli motori che possano lavorare rapidamente e silenziosamente in sincronia. Secondo, lo schema specifico della dinamica delle labbra è una funzione complessa dettata da sequenze di suoni vocali e fonemi.

I volti umani sono animati da dozzine di muscoli che si trovano appena sotto una pelle morbida e si sincronizzano naturalmente con le corde vocali e i movimenti delle labbra. Al contrario, i volti umanoidi sono perlopiù rigidi, operano con relativamente pochi gradi di movimento e il loro movimento labiale è coreografato secondo regole rigide e predefinite. Il risultato è un movimento impacciato, innaturale e inquietante.

In questo studio, i ricercatori hanno superato questi ostacoli sviluppando un volto flessibile e riccamente motorizzato, permettendo poi al robot di imparare a usarlo direttamente osservando gli esseri umani. Per prima cosa, hanno posizionato un volto robotico dotato di 26 motori davanti a uno specchio, così che il robot potesse imparare come il suo stesso viso si muove in risposta all’attività muscolare. Come un bambino che fa smorfie allo specchio per la prima volta, il robot ha eseguito migliaia di espressioni facciali e gesti labiali casuali. Col tempo, ha imparato a muovere i suoi motori per ottenere particolari configurazioni del viso, un approccio chiamato modello linguistico “vision-to-action” (VLA).

Poi, i ricercatori hanno posizionato il robot davanti a video registrati di esseri umani che parlavano e cantavano, dando all’IA che controlla il robot l’opportunità di imparare esattamente come si muovono le bocche umane in relazione ai vari suoni emessi. Con questi due modelli a disposizione, l’IA del robot poteva ora tradurre l’audio direttamente in azioni dei motori delle labbra.

I ricercatori hanno testato questa capacità utilizzando una varietà di suoni, lingue e contesti, oltre ad alcune canzoni. Senza alcuna conoscenza specifica del significato delle clip audio, il robot è riuscito a muovere le labbra in sincronia.

I ricercatori riconoscono che il movimento delle labbra è tutt’altro che perfetto. «Abbiamo avuto particolari difficoltà con suoni duri come la ‘B’ e con suoni che richiedono l’increspamento delle labbra, come la ‘W’. Ma queste capacità probabilmente miglioreranno con il tempo e la pratica», ha detto Lipson.

Ancora più importante, però, è considerare il lip sync come parte di una capacità comunicativa robotica più olistica.

Il dottor Yuhang Hu (3), che ha guidato lo studio, racconta: «Quando la capacità di sincronizzazione labiale viene combinata con un’IA conversazionale come ChatGPT o Gemini, l’effetto aggiunge una profondità completamente nuova alla connessione che il robot instaura con l’essere umano. Più il robot osserva gli esseri umani conversare, meglio diventerà nell’imitare quei gesti facciali sfumati con cui possiamo connetterci emotivamente e più lunga è la finestra contestuale della conversazione, più sensibili al contesto diventeranno questi gesti».

L’anello mancante delle capacità robotiche

I ricercatori ritengono che l’affettività facciale sia l’“anello mancante” della robotica.

Secondo il dottor Hod Lipson, «Gran parte della robotica umanoide oggi è focalizzata sul movimento delle gambe e delle mani, per attività come camminare e afferrare. Ma l’affettività facciale è altrettanto importante per qualsiasi applicazione robotica che coinvolga l’interazione umana».

Lipson e Hu prevedono che volti caldi e realistici diventeranno sempre più importanti man mano che i robot umanoidi troveranno applicazione in settori come l’intrattenimento, l’istruzione, la medicina e persino l’assistenza agli anziani. Alcuni economisti prevedono che oltre un miliardo di umanoidi sarà prodotto nel prossimo decennio.

«Non esiste un futuro in cui tutti questi robot umanoidi non abbiano un volto. E quando finalmente avranno un volto, dovranno muovere correttamente occhi e labbra, altrimenti rimarranno per sempre inquietanti», stima Lipson.

«Noi esseri umani siamo semplicemente fatti così, non possiamo farci nulla. Siamo vicini ad attraversare l’uncanny valley», ha aggiunto Hu.

Rischi e limiti

Questo lavoro fa parte della ricerca decennale di Lipson volta a trovare modi per far sì che i robot si connettano più efficacemente con gli esseri umani, attraverso la padronanza di gesti facciali come sorridere, guardare e parlare. Egli insiste sul fatto che queste capacità debbano essere acquisite tramite apprendimento, piuttosto che programmate con regole rigide.

«Accade qualcosa di magico quando un robot impara a sorridere o a parlare semplicemente osservando e ascoltando gli esseri umani», ha detto. «Sono un roboticista disincantato, ma non posso fare a meno di sorridere a un robot che mi sorride spontaneamente».

Il professor Hu ha spiegato che i volti umani sono l’interfaccia definitiva per la comunicazione, e stiamo iniziando a svelarne i segreti.

«I robot con questa attitudine avranno chiaramente una capacità molto migliore di connettersi con gli esseri umani, perché una parte così significativa della nostra comunicazione coinvolge il linguaggio corporeo facciale, e tutto questo canale è ancora inutilizzato», sostiene Hu.

I ricercatori sono consapevoli dei rischi e delle controversie legate al concedere ai robot una maggiore capacità di connettersi con gli esseri umani.

«Questa sarà una tecnologia potente. Dobbiamo procedere lentamente e con cautela, così da poter raccogliere i benefici minimizzando i rischi», ha concluso Lipson.

Aurori dello studio: Yuhang Hu, Jiong Lin, Judah Allen Goldfeder, Philippe M. Wyder, Yifeng Cao, Steven Tian, Yunzhe Wang, Jingran Wang, Mengmeng Wang, Jie Zeng, Cameron Mehlman, Yingke Wang, Delin Zeng, Boyuan Chen e Hod Lipson. Finanziatori: Lo studio è stato supportato dall’US National Science Foundation (NSF) AI Institute for Dynamical Systems (DynamicsAI.org) e da una elergizione dell’Amazon to Columbia AI institute.

Riferimenti:

(1) Learning realistic lip motions for humanoid face robots

(2) Hod Lipson

(3) Yuhang Hu

Descrizione foto: Presentato sulla copertina di Science Robotics, Hod Lipson e il suo team hanno creato un robot che, per la prima volta, è in grado di apprendere i movimenti delle labbra facciali per compiti come parlare e cantare. – Credit: Jane Nisselson/ Columbia Engineering.

Autore traduzione riassuntiva e adattamento linguistico: Edoardo Capuano / Articolo originale: A Robot Learns to Lip Sync

Fonte: ecplanet.net

Muscoli artificiali per robot serpenti

Gli ingegneri hanno sviluppato un nuovo dispositivo morbido e flessibile che fa muovere i robot espandendosi e contraendosi, proprio come un muscolo umano.

Per dimostrare il loro nuovo dispositivo, chiamato attuatore, i ricercatori lo hanno utilizzato per creare un robot morbido cilindrico, simile a un verme, e un bicipite artificiale. Negli esperimenti, il robot cilindrico ha percorso le curve a forcina di uno stretto ambiente simile a un tubo e il bicipite è stato in grado di sollevare un peso di 500 grammi 5.000 volte di seguito senza fallire.

Poiché i ricercatori hanno stampato in 3D il corpo dell’attuatore morbido utilizzando una gomma comune, i robot risultanti costano circa 3 dollari in materiali, escluso il piccolo motore che guida il cambiamento di forma dell’attuatore. Ciò contrasta nettamente con i tipici attuatori rigidi e rigidi utilizzati nella robotica, che spesso costano da centinaia a migliaia di dollari.

Il nuovo attuatore potrebbe essere utilizzato per sviluppare robot economici, morbidi e flessibili, che siano più sicuri e più pratici per le applicazioni del mondo reale, hanno affermato i ricercatori

«I robotisti sono motivati da un obiettivo di lunga data: rendere i robot più sicuri», ha affermato il dottor Ryan Truby (1) della Northwestern, che ha guidato lo studio, pubblicato su Advanced Intelligent Systems (2). «Se un robot morbido colpisse una persona, non gli farebbe male tanto quanto essere colpiti da un robot rigido e duro. Il nostro attuatore potrebbe essere utilizzato in robot più pratici per ambienti incentrati sull’uomo. E, poiché sono poco costosi, potremmo potenzialmente usarne di più in modi che, storicamente, sono stati troppo proibitivi».

Truby è il professore junior di scienza e ingegneria dei materiali e ingegneria meccanica di June e Donald Brewer presso la McCormick School of Engineering (3), dove dirige il Robotic Matter Lab (4). Taekyoung Kim, uno studioso post-dottorato nel laboratorio di Truby e primo autore dell’articolo, ha guidato la ricerca. Pranav Kaarthik, un dottorato di ricerca. Anche il candidato in ingegneria meccanica ha contribuito al lavoro (5).

Robot che “si comportano e si muovono come organismi viventi”

Sebbene gli attuatori rigidi siano stati per lungo tempo la pietra angolare della progettazione dei robot, la loro flessibilità, adattabilità e sicurezza limitate hanno spinto gli esperti di robotica a esplorare gli attuatori morbidi come alternativa. Per progettare attuatori morbidi, Truby e il suo team hanno cercato di realizzare materiali che si muovano come i muscoli umani, che si contraggono e si irrigidiscono contemporaneamente.

«Se riusciamo a farlo, allora possiamo creare robot che si comportino e si muovano come organismi viventi», ha detto Ryan Truby.

Per sviluppare il nuovo attuatore, il team ha stampato in 3D strutture cilindriche chiamate “handed shearing auxetics” (HSA). Gli HSA incorporano una struttura complessa che consente movimenti e proprietà unici, ad esempio l’estensione e l’espansione quando vengono ruotati. Quando in passato Truby e Kaarthik stampavano in 3D strutture simili per i robot, erano costretti a utilizzare stampanti costose e resine plastiche rigide.

Questa volta, Kim ha stampato gli HSA dal poliuretano termoplastico, una gomma comune ed economica spesso utilizzata nelle custodie dei cellulari. Ciò ha reso gli HSA molto più morbidi e flessibili e ha permesso ai ricercatori di fabbricarli con una stampante 3D desktop facilmente disponibile.

Semplificare l’intera tubatura

Le versioni precedenti degli attuatori morbidi HSA utilizzavano servomotori comuni per torcere i materiali negli stati estesi ed espansi. Ma i ricercatori hanno ottenuto un azionamento efficace solo dopo aver assemblato insieme due o quattro HSA, ciascuno con il proprio motore. La costruzione di attuatori morbidi in questo modo presentava sfide operative e di fabbricazione. Ha inoltre ridotto la morbidezza degli attuatori HSA.

Per costruire un attuatore morbido migliorato, i ricercatori miravano a progettare un singolo HSA azionato da un servomotore. La soluzione di Kim è stata quella di aggiungere un soffietto di gomma alla struttura che funzionasse come un albero rotante e deformabile. Quando il motore forniva coppia, un’azione che fa ruotare un oggetto, l’attuatore si estendeva. La semplice rotazione del motore in una direzione o nell’altra fa sì che l’attuatore si estenda o si contragga come un muscolo.

«Taekyoung ha notevolmente semplificato l’intera pipeline con la stampa 3D», ha affermato Truby. «Ora disponiamo di un pratico attuatore morbido che qualsiasi esperto di robotica può utilizzare e realizzare».

Il soffietto ha aggiunto un supporto sufficiente affinché Kim potesse costruire un robot morbido e strisciante partendo da un singolo attuatore che si muoveva da solo. I movimenti di spinta e trazione dell’attuatore spingevano il robot in avanti attraverso un ambiente tortuoso e vincolato che simulava un tubo.

«Il nostro robot può eseguire questo movimento di estensione utilizzando un’unica struttura», ha affermato Kim. «Ciò rende il nostro attuatore più utile perché può essere integrato universalmente in tutti i tipi di sistemi robotici».

Il pezzo mancante: l’irrigidimento muscolare

Il robot simile a un verme risultante era compatto (misurava solo 26 centimetri di lunghezza) e strisciava, sia avanti che indietro, a una velocità di poco più di 32 centimetri al minuto. Truby ha notato che sia il robot che il bicipite artificiale diventano più rigidi quando l’attuatore è completamente esteso, un’altra proprietà che i precedenti robot morbidi non erano in grado di raggiungere.

«Come un muscolo, questi attuatori morbidi in realtà si irrigidiscono», ha detto Truby. «Se hai mai tolto il coperchio da un barattolo, ad esempio, sai che i tuoi muscoli si stringono e diventano più rigidi per trasmettere la forza. È così che i tuoi muscoli aiutano il tuo corpo a lavorare. Questa è stata una caratteristica trascurata nella robotica morbida. Molti attuatori morbidi diventano più morbidi durante l’uso, ma i nostri attuatori flessibili diventano più rigidi durante il funzionamento».

Truby e Kim affermano che il loro nuovo attuatore rappresenta un ulteriore passo avanti verso robot più ispirati alla biotecnologia.

«I robot che possono muoversi come organismi viventi ci consentiranno di pensare a robot che eseguono compiti che i robot convenzionali non possono svolgere», ha concluso Truby.

Autore traduzione riassuntiva e adattamento linguistico: Edoardo Capuano / Articolo originale: Creating artificial ‘muscles’ for safer, softer robots

I robot per la sorveglianza della Boston Dynamics sono pronti per essere commercializzati nel 2019

Robot SpotMini e il robot AtlasUna società di robotica, nota per i suoi video di agili robot che aprono porte o camminano su superfici irregolari, si prepara a venderne alcuni dopo più di un quarto di secolo di ricerche.

Si tratta della Boston Dynamics.(1) Marc Raibert,(2) il CEO dell’azienda, ha confermato alla stampa che l’anno prossimo la società inizierà a vendere il robot SpotMini(3) equipaggiato di telecamere installate nella parte anteriore, laterale e posteriore. È facile intuire che le aziende lo acquisteranno per la sorveglianza degli ambienti.

Marc Raibert ritiene possibile che più aziende svilupperanno altre applicazioni per il robot a quattro zampe perché ha una piattaforma piatta che facilita l’installazione di altre apparecchiature con la propria programmazione.

Nel catalogo della Boston Dynamics ci sono 10 SpotMini e l’azienda prevede di costruirne altri 100 da testare entro quest’anno prima di iniziare la produzione su larga scala a metà del 2019, ha detto Raibert. Nessun prezzo è stato ancora fissato per il robot. Tuttavia, il costo del prototipo più recente è inferiore di circa un decimo rispetto al prezzo delle versioni precedenti.

Marc Raibert ha annunciato queste sue strategie aziendali al campus dell’Università della California di Berkeley(4) nel corso della conferenza sulla robotica di TechCrunch(5) che si concentra sulle innovazioni del settore e le loro prestazioni potenziali in vari rami e lavori svolti attualmente dagli esseri umani.

Fondata nel 1992, la società raramente rivela i suoi piani tranne quando pubblica i suoi video su YouTube che hanno stupito e anche, in qualche occasione, pure terrorizzato il pubblico. La maggior parte della ricerca sulla robotica alla Boston Dynamics era stata applicata al settore militare fino a quando Google ha acquistato la ditta Waltham (Massachusetts) nel 2013 e infine l’ha venduta lo scorso anno al gigante tecnologico giapponese SoftBank.

Sebbene Boston Dynamics non abbia mai lanciato un robot commerciale durante il suo periodo in Google, il direttore Marc Raibert ha detto che è stata la società che ha contribuito a pensare a come portare la sua tecnologia in un mercato più ampio.

Verso la fine della sua presentazione, ha anche mostrato un video di Atlas,(6) un robot a due gambe che ha imparato a ordinare e raccogliere pacchetti, saltare blocchi, fare jogging e saltare all’indietro. Raibert ha indicato che la Boston Dynamics non ha ancora pensato a un modo per trarre profitto da Atlas.

Riferimenti:

(1) Boston Dynamics

(2) Marc Raibert

(3) Robot SpotMini

(4) University of California, Berkeley

(5) Marc Raibert – TechCrunch

(6) Robot Atlas

http://www.ecplanet.com

Foto: Boston Dynamics