Mnnnn, diría que para animar al personaje está utilizando multitalk (sus manos, movimientos, o sincronizar el audio con los labios).
El audio por su parte es mejorable, aunque utilizando Elevenlabs se pueden conseguir cosas bastante decentes (pero también es verdad que es de pago).