DivideConcept.net

le blog de divide.

Archive pour avril 2012

Pour rappel en juin dernier sur ce blog j’ai annoncé le projet sur lequel je travaillais depuis maintenant 3 ans, Spectral Layers, une sorte de Photoshop pour le son.
Quelques mois après la première release publique, retour sur toute l’histoire du projet et premier bilan…

La genèse du projet

Le concept des transformées de Joseph Fourier est remarquable; cette formule mathématique imaginée au 19em siècle permet de transformer un signal en une somme de fréquences, et elle reste toujours indétrônée à ce jour (les ondelettes ne sont qu’un dérivé de cette formule de base). Je ne suis pas encore sur de comprendre par quelle magie ce miracle est possible, mais ça fonctionne !

Si Spectral Layers a vu le jour c’est grâce à ce concept, le besoin pour moi d’avoir un outil performant pour nettoyer des prises audio de tournages et l’envie de faire un de ces outils tordus qu’on voit dans Les Experts -mais qui n’existaient pas réellement jusque là-. En observant l’empreinte de la voix (séries d’harmoniques) dans un spectrogramme, je me suis dit qu’il y avait certainement là moyen de développer un outil similaire à Photoshop pour faire rapidement des détourages et des extractions de tous les composantes audio d’un enregistrement, en tout cas de manière bien plus propre et efficace que ce qui était proposé jusque là sur le marché.

Développement

En juin 2009 je me suis donc attaqué à la réalisation de cette idée; initialement Spectral Layers ne devait être qu’un outil de détection automatique d’harmoniques puisant dans un fichier A pour extraire les fréquences dans un fichier B, on était loin du concept actuel. L’idée a beaucoup évolué dans les premiers mois, passant petit à petit de simple système automatisé à un concept plus général impliquant des outils, puis des calques, pour finalement venir se rapprocher du concept de Photoshop appliqué au son.

Ciblant à la fois les labos et les studios, le logiciel devait être multiplateforme (Windows/Mac). J’ai donc arrêté mon choix sur le framework Qt, qui offre à la fois ce coté multiplateforme unifié tant au niveau du framework que de l’IDE (Qt Creator), une facilité d’accès unifiée à tous les modules possibles (interface, son, reseau, threading, opengl, tablette graphique, etc etc), un astucieux système de connection de fonctions (signal/slot), une documentation exhaustive et une communauté très active. Un choix que je n’ai pas eu à regretter par la suite !

Au cours du développement je me suis rendu compte que si je voulais obtenir un moteur temps réel efficace malgré tous ces calculs assez lourd, il fallait que je m’inspire au maximum des techniques utilisées dans les jeux vidéo; m’étant plusieurs fois penché sur les concepts de displacement mapping, c’est naturellement que je me suis tourné vers OpenGL pour avoir un affichage 3D temps réel du spectre; et sans rentrer dans les détails, le principe de recalcul du spectre au cours des transformations et de la navigation est assez similaire au streaming d’une map dans Grand Theft Auto.

Financement… ou pas

Après 1 an de développement, ayant obtenu un proof-of-concept -le principe d’extraction audio marchait-, j’ai commencé à me poser la question du financement (je vivais jusque là sur les ventes de mon premier projet, GPU Decoder).
En France il existe plusieurs aides à l’innovation, notamment OSEO et d’autres aides régionales comme le Centre Francilien de l’Innovation. Fort de mes premiers résultats, j’ai contacté et rencontré la plupart de ces organismes publiques. Et bien ça a été la douche froide.

Etant seul sur le projet, il m’était impossible de débloquer le moindre financement : toutes ces aides publiques demandent au minimum deux personnes sur chaque projet (en gros celui qui a l’idée du projet, et celui qui porte le projet). Et quand bien même, la plupart de ces aides ne sont que des avances sur recette, et dans tous les cas elles ne peuvent couvrir qu’à hauteur d’une somme qu’on possède déjà : si on veut obtenir 10.000€, il faut déjà avoir 10.000€ en caisse.
Quelques investisseurs privés se sont manifestés par la suite (après l’annonce publique), mais comme j’étais déjà proche de la fin du développement ça ne valait pas le coup de diluer la propriété du projet.
Je m’en suis donc tenu au RSA, et quelques commandes ponctuelles…

Je tiens d’ailleurs à souligner que ce “financement”, aussi minimal soit-il, m’a néanmoins permis de tenir sur les 2 ans de développement en roue libre; sans ça il aurait été beaucoup plus difficile de tenir la distance avec les seuls revenus de ma compagne. Reprendre un travail salarié en parallèle aurait très certainement tué toute motivation sur le peu de temps libre restant. D’autre part si ces rentrés ont été possibles sur une telle durée c’est grâce à l’existence conjointe du statut d’Auto-Entrepreneur, qui j’espère arrivera à perdurer tel quel dans les années à venir : pour avoir connu l’ancien statut de Micro-BNC avant 2009, l’auto-entreprise est une véritable aubaine pour tous ceux qui souhaitent se mettre à leur compte.

Alpha-tests

Au fur et à mesure que tout ça se développait et commençait à prendre forme, j’ai commencé à en parler en privé à quelques personnes de mon entourage susceptibles de me faire des retours : entre “un concept” et “un concept utilisable et ergonomique” il y a un gouffre dont je me suis rendu compte petit à petit ! Je tiens d’ailleurs à remercier Whisper, Darkstryder, Skaven et __MaX__ au passage qui m’ont fait de précieux retours, l’ergonomie (et la stabilité) du logiciel a beaucoup évolué durant cette phase. J’étais loin d’imaginer l’importance de ces détails, qui ne sont pas forcément évidents quand on a le nez dans le projet depuis le début et qui pourtant changent complètement la manière d’appréhender l’outil. L’idée étant de rendre tout un maximum naturel et intuitif, en essayant de se rapprocher autant que possible de différents concepts déjà bien connus (dans mon cas, Photoshop et les logiciels de montage audio classiques). Cette phase a durée facilement entre 6 mois et 1 an.

J’en profite pour parler temps et motivation : au début j’étais loin d’imaginer que je m’embarquais pour plus de 2 ans de travail (je pensais naïvement 1 an tout au plus). Garder la motivation sur de telles périodes est difficile, surtout quand on travail seul sur un projet sans avoir de retours. Au cours du développement j’ai eu 2 breaks d’un mois, dues aux vacances et aux difficultés techniques qui me donnaient l’impression que tout ça ne serait jamais viable. Sur un projet aussi long il est vraiment important d’avoir la foi …et une checklist de taches à accomplir tous les 2 ou 3 jours (sortes de mini milestones), pour avoir un ressentie de progression. Et si l’idée en vaut la peine, ne pas hésiter à jeter tout une partie de l’architecture si elle risque d’handicaper la suite du développement (ça a été le cas pour le moteur d’affichage qui a du être recodé entièrement au bout de 6 mois de développement pour intégrer un système de streaming spectral).


Spectral Layers en avril 2010, juin 2010, novembre 2010, juin 2011, avril 2012

Annonce publique, contacts, et beta-tests

Après 2 ans de développement, le logiciel commençant à prendre sa forme finale, il était temps de faire bouger un peu les choses. Je ne savais pas trop ce qui pouvait ressortir d’une annonce publique, mais c’était le seul moyen à mon niveau de créer du contact autour de ça, tant pis pour la confidentialité du projet.
Ca a donc commencé ici même sur ce blog, puis ça s’est propagé à quelques médias français. Malgré l’accueil positif et quelques contacts qui se sont créés, il faut bien avouer que tant que l’info est resté en France, le soufflé est assez vite retombé et ça n’a pas aboutit sur grand chose de concret.
J’ai alors harcelé un site américain influent pour décrocher une news, et à partir de là… Ça s’est emballé au delà de mes espérances !

La vidéo de teasing que j’avais mis en ligne annonçait que le logiciel passait en phase 2 d’alpha-tests, en fait un appel du pied pour sonder les industries intéressées et faire tester le logiciel par quelques gros clients potentiels. C’est en effet ce qui s’est passé : sur les 100 testeurs sélectionnés, très peu m’ont en réalité fait des retours utiles, mais niveau contact j’ai été servis ! Hormis les industries classiques (cinéma, musique, radio, etc…) j’ai été contacté pour des utilisations auxquelles je n’aurai jamais songé, comme du sondage géologique, et même par quelques farfelus chasseurs de fantôme (apparemment un sport aux Etats Unis, ils sont plusieurs groupes à faire ça) et un illuminé persuadé d’avoir des enregistrements satanistes subliminaux.

Cette dernière phase de test a duré 6 mois, pendant lesquels j’ai pu voir les problématiques de productions : besoin de rajouter des connections avec les gros softs audio du marché, de supporter tel format ou périphérique, etc.
Dans cette phase je me suis énormément servis de LinkedIn, soit pour contacter des sociétés en vue d’obtenir les SDK/infos nécessaires, soit pour trouver de nouveaux testeurs bien placés. Ce réseau a été particulièrement précieux durant cette phase du projet, court-circuitant les points d’entrée classiques des grosses entreprises.
J’ai également profité de cette période pour récolter autant de témoignages possibles avant la mise en vente publique du logiciel.

Mise en vente, clients et utilisations

Fin 2011 les ventes de Spectral Layers ont commencés via le site de ma boite Divide Frame. Il était temps, j’étais presque à sec niveau finance…
J’ai mis en ligne une vidéo de lancement et contacté plusieurs médias pour l’occasion, mais il faut bien reconnaître que Relation Presse et Commercial, ce sont des métiers à plein temps dont je suis loin d’avoir l’expérience ! Jusque là le logiciel s’est vendu correctement à mon petit niveau, mais sans un département dédié à plein temps sur ce job il est difficile d’atteindre les volumes de ventes du marché, quelles que soient les qualités du logiciel.

Si quantitativement le succès est discutable, en revanche qualitativement je suis ravis d’avoir pu toucher certaines cibles;
Ainsi en 2011/2012 vous pouvez entendre Spectral Layers sur les blockbusters suivants:

Black Gold (Or Noir)
Contagion
Men In Black 3
Total Recall
Sinister
Twilight: Breaking Dawn Part 2
The Hobbit: An Unexpected Journey

Niveau musique, il est également utilisé par le groupe Hybrid et Solar Fields.

Last but not least, Divide Frame est depuis peu officiellement fournisseur du gouvernement américain, département de la défense et de la justice…
La boucle est bouclée, Spectral Layers a fait son chemin jusqu’aux Experts !

Et maintenant ?

Après 9 mois de négociations (qui mériteraient vraiment un post-mortem à part, mais je crains que pour le coup ce ne soit trop sensible pour en parler ici),
Sony devient officiellement distributeur de Spectral Layers ! Il rejoint donc Vegas, Sound Forge et Acid et sera ainsi le 4em logiciel de production Sony Creative Software.
Cet accord permettra une diffusion plus large, des licenses plus accessibles et différentes améliorations techniques et d’ergonomie.
Le partenariat a été dévoilé cette nuit au NAB et le logiciel est en démonstration sur le stand Sony depuis aujourd’hui.

SONY SHOWCASES NEW TECHNOLOGY AT NAB

Precision Waveform Editing Application and Plug-in for Automated Themes in Vegas™ Pro 11 Showcased at 2012 NAB Show

LAS VEGAS – April 17, 2012 [NAB Show - Booth #C11001] – Sony Creative Software, a leading global provider of professional editing and authoring applications, announced new, innovative audio and video editing tools for professionals set for release this summer. The latest additions to the Sony Creative Software product line include: Spectral Layers, developed by Divide Frame, which is an audio editing platform featuring precise sound shaping capabilities and a unique visual workflow; and the ThemeBuilder plug-in for Vegas™ Pro, developed by NewBlue, that enables intelligent template building for professional video projects. Both provide industry professionals with powerful editing capabilities and are scheduled for technology demonstrations in the Sony booth.

[...] “Spectral Layers redefines what can be accomplished in the editor’s suite by giving users the ability to reach directly into and operate on waveform spectra. Spectral Layers holds universal appeal for audio mastering engineers, sound designers, archivists, and professionals who demand deep, intelligent audio analysis tools.” said Dave Chaimson, Vice President of Global Marketing for Sony Creative Software.

[...] Based in Paris, Divide Frame specializes in software designs that bridge the gap between emergent technologies and broadcast professionals. Innovative workflow ideas and processing speed optimization are just two design hallmarks of this advanced R&D firm.

“I’ve been a fan of Sony Creative Software products for many years,” said Robin Lobel, owner of Divide Frame. “Our Spectral Layers application will be a perfect fit for users of both Vegas and Sound Forge. Divide Frame is pleased to have Spectral Layers take its place alongside Sony Creative Software’s classic video and audio heavy hitters.”

SUITE 27/10/2012: SpectraLayers goes to San Francisco