Ahora conocemos que la investigación sobre los Papeles de Panamá no hubiera sido posible sin la concurrencia de la tecnología, en concreto del software de la empresa australiana NUIX. Los más de 2.6 TB de información ha podido ser categorizada y los periodistas han podido realizar búsqueda de texto en los documentos, muchos de ellos manuscritos escaneados, gracias al uso de tecnologías de reconocimiento óptico de caracteres que los transforman en texto

imovilizate20042016

La tecnología vital para desentrañar los Papeles de Panamá

Los papeles de Panamá, la filtración de más de 11,5 millones de documentos del bufete de abogados panameño Mossack Fonseca ha expuesto a la opinión pública las vergüenzas, al menos las fiscales, de personajes públicos en un buen número de países. Sin ir más lejos, aquí en España, el Ministro de Industria José Manuel Soria.

La tecnología, o su uso, han tenido mucho que ver con que esos documentos fuesen desvelados. La primera noticia sobre los papeles de Panamá es cuando una fuente anónima pone a disposición del rotativo alemán Süddeutsche Zeitiung 2.6 TB de documentos, todos ellos del bufete Mossack Fonseca, una de las firmas panameñas especializadas en formalización de sociedades offshore.

Semejante cantidad de datos, 2.6 TB de datos, era poco manejable a la hora de hacer un trabajo periodístico, por lo que el Consorcio Internacional de Periodistas de Investigación (ICIJ) y los periodistas del Süddeutsche Zeitung utilizaron un software específico para cribar esos datos.

Las aplicaciones utilizadas son de la firma australiana NUIX. Con dicho software se ha logrado indexar y analizar todos los casi 3 TB de datos. Sobre los datos, muchos de ellos documentos manuscritos que habían sido escaneados, se utilizó una aplicación mediante reconocimiento óptico de caracteres transforma el texto en algo sobre lo que se pueden acceder búsquedas de texto.

Sobre los documentos también se utilizó una tecnología denominada named entity extraction que permitió a los periodistas buscar nombres propios y patrones fácilmente identificables. No es la primera vez que el ICIJ utiliza el software de NUIX en sus investigaciones periodísticas.

La empresa australiana está tan implicada en la transparencia a la que aspira ICIJ con sus investigaciones que permite el uso del software NUIX de una manera completamente libre sin tener que pagar licencias por él.

La labor de NUIX no se quedó ahí en esta investigación ya que ha realizado labores de consultoría sobre este proyecto en concreto, sobre todo a nivel del hardware más indicado para sacar el máximo jugo a esta investigación periodística.

¿Te ha gustado el artículo de iMovilizate? Síguenos en Twitter y Facebook y ayúdanos a su difusión compartiéndolo con tus amigos en Twitter, Facebook o G+ con los botones que encontrarás al final del artículo. ¡Gracias!

Gonzalo Sanchez del Pozo (405 Posts)