domenica 25 ottobre 2020

Software Per Creare Video Fake: DeepFaceLab, TensorFlow, Face2Face

"If everything is real, then nothing is real"

Utilizzare il proprio volto sul corpo di un altro (celebrità compresa) in un video è molto semplice e può essere fatto con un tool open source chiamato OpenFaceLab.
Questi video si basano su tecnologie sofisticate come le reti neurali.
A maggio, i ricercatori del Samsung AI Center di Mosca hanno dato l'esempio perfetto di questo concetto, sviluppando un modo per creare "ritratti viventi" da un dataset molto ridotto.
L'articolo è intitolato "Few-Shot Adversarial Learning Of Realistic Neural Talking Head Models".
La tecnica sviluppata dai ricercatori si basa sull'utilizzo di una o pochissime immagini per allenare il modello e creare un ritratto animato convincente. 
Con l'aggiunta di qualche scatto in più o 32 fotografie, il realismo migliora nettamente.
Poiché necessitano solo di un'immagine sorgente, i ricercatori sono riusciti ad animare dipinti e ritratti fotografici famosi, con risultati a dir poco inquietanti. 
Questi "modelli fotorealistici di mezzibusti parlanti" sono creati usando reti neurali convoluzionali (o CNN): i ricercatori hanno allenato un algoritmo su un ampio dataset di video di primi piani di persone che parlano, tutte di aspetti fisici diversi.
In questo modo il programma si abitua a identificare ciò che i ricercatori chiamano "i punti di riferimento" del volto: occhi, posizioni della bocca, lunghezza e forma del setto nasale.
La differenza, rispetto ad altre tecniche o algoritmi che usano le reti generative avversarie, è significativa. Anziché insegnare all'algoritmo come incollare una faccia su un'altra usando un catalogo di espressioni prelevate da una persona sola, usano i tratti del viso che sono comuni alla maggior parte delle persone per poi manovrare a proprio piacimento il nuovo volto.
Poi ci sono altre tecniche che usano l'approssimazione digitale, ricreata grazie alla tecnica dello face-swap per fare sembrare che il protagonista stia facendo una determinata cosa.
Il video è stato realizzato con un algoritmo di machine learning, utilizzando delle immagini facilmente accessibili e del codice open-source che chiunque con una conoscenza base degli algoritmi di Deep Learning può gestire.
Per una guida: OpenFaceLab (Guida)
Altri strumenti di machine learning open-source sono TensorFlow (libreria software per il ML), messo a disposizione gratuitamente da Google per ricercatori, studenti e chiunque si interessi di machine learning.
Proprio come il tool Adobe (per creare e montare video) che può far dire di tutto alle persone e l'algoritmo Face2Face che può sovrapporre ad un video registrato in precedenza dei movimenti del volto di un'altra persona rilevati in tempo reale, questo nuovo genere di video fake dimostra come stiamo per vivere in un mondo in cui è estremamente facile produrre dei video credibili di persone che fanno e dicono cose che non hanno mai fatto.
Il software è basato su diverse librerie open-source, come Keras con TensorFlow in backend. 
Il Deep Learning consiste in reti di nodi interconnessi che eseguono autonomamente dei calcoli su una serie di dati forniti in input.
Gli algoritmi vengono fatti lavorare con un video pre-impostato e il volto che si vuole usare.
Dopo che hanno eseguito per un po' questo "training", i nodi si organizzano per manipolare dei video in tempo reale in modo convincente.
Per il face-swap avendo a disposizione centinaia di immagini si possono generare facilmente milioni di immagini 'distorte' per addestrare la rete. Dopodiché, fornendo in input il volto di qualcun altro, la rete penserà che sia solo un'altra immagine distorta e cercherò di farla sembrare il volto su cui si è già 'allenata'.

Nessun commento:

Posta un commento