Transkriptorium quiere indexar la historia de la humanidad y promete una revolución en la archivística

>>  lunes, 1 de marzo de 2021

Transkriptorium quiere indexar la historia de la humanidad: la IA de esta startup es capaz de digitalizar caligrafía incluso del siglo XV, y promete una revolución en la archivística
https://www.businessinsider.es/



Transkriptorium le da una vuelta a las tecnologías OCR con su tecnología HTR, siglas en inglés de;reconocimiento de textos escritos a mano. Mediante inteligencia artificial y aprendizaje automático, sus redes neuronales son capaces de detectar y mejorar cada vez más su detección de caracteres de todo tipo, estén como estén caligrafiados. Para garantizarle un futuro y una viabilidad a la start up, aquí entra en escena su recién incorporado CEO, Luis Antonio Morró, quien en conversación con Business Insider España detalla algunas de las claves de esta tecnología y su potencial empresarial. Cuando evalúo el proyecto me encuentro con una tecnología impresionante que ahora ya hemos orientado y convertido en un producto paquetizable, vendible y escalable, que es el que todas las de base tecnológica deben tener. Los primeros en adoptar a los que nos hemos dirigido aseguran que nuestra tecnología es incluso un cambio de paradigma en el tratamiento de textos digitalizados, afirma. https://www.businessinsider.es/descubrimientos-han-alterado-comprension-historia-humana-784285"

13 descubrimientos del año pasado que han alterado radicalmente nuestra comprensión de la historia humana Morró continúa: Los sistemas OCR están extenuados, ya no se puede sacar más de ellos, y mucha gente se ha acostumbrado y ha asumido que es lo que hay. Pero con el sistema HTR se empieza justo donde la capacidad del OCR termina. Los investigadores de la UPV, que son unas verdaderas bestias, han desarrollado una herramienta capaz de reconocer texto caligrafiado ¿Para qué sirve? Por lo pronto, para poder indexar en la red todo el conocimiento de la humanidad. Suena grandilocuente, pero es literalmente lo que ha empezado a hacer Transkriptorium probando su tecnología con archivos históricos, como el Provincial de Cádiz o el de Indias. Transkriptorium redescubrió Australia El valor que una herramienta de estas características puede tener para la historiografía es incalculable. Su primer proyecto indexa más de 370 carpetas del Archivo Provincial de Cádiz y del Archivo General de Indias con la libertad que supone para un investigador buscar referencias a un personaje o a un buque simplemente escribiendo las palabras claves como si se tratara de Google, algo que "http://prhlt-carabela.prhlt.upv.es/carabela/" puedes comprobar aquí. Un ejemplo del potencial de la herramienta es precisamente el descubrimiento de referencias a una ignota tierra austral que apunta a que los españoles descubrieron Australia mucho antes que los británicos, "https://www.abc.es/espana/comunidad-valenciana/abci-carabela-inteligencia-artificial-desvela-secretos-historia-espana-201910231321_video.html" como detallaba el diario a finales de 2019 "https://www.businessinsider.es/deeder-spinoff-telefonica-tech-caza-mercado-legaltech-740967" De plugin a start up: Deeder, la de Eleven Paths y Telefónica Tech que quiere que firmes contratos por WhatsApp, al asalto del mercado legal tech. Morró recuerda el caso de la empresa Odysey, que https://www.rtve.es/noticias/20110921/tribunal-eeuu-da-razon-juez-ordeno-odyssey-entregar-tesoro-espana/463180.shtml" expolió un antiguo pecio hundido a principios del siglo XIX frente a las costas de Cádiz, tras una batalla naval contra buques ingleses. La firma estadounidense desvalijó el tesoro que escondía el antiguo barco español y el CEO de Transkriptorium rememora que los arqueólogos españoles tardaron años en armar toda la historiografía que respaldase la denuncia del Estado español por la que acabaría recuperando los restos. Gracias a Transkriptorium y a su herramienta, conectada a los archivos antes citados, la IA fue capaz de indexar todos los documentos y detectar las referencias a Nuestra Señora de las Mercedes tal y como se conocía este buque— en cuestión de 7 días. Pero Transkriptorium no se ciñe al trabajo historiográfico. El potencial de una plataforma que puede revolucionar cómo se escanean y digitalizan documentos es amplio: Morró plantea en su entrevista con Business Insider España el posible lanzamiento de un portal para que los usuarios prueben cómo funciona esta tecnología permitiendo digitalizar, por ejemplo, apuntes de universidad. Interés de consultoras IT y fabricantes de hardware

Y en cuanto a la proyección comercial, Transkriptorium, que apenas suma un mes y medio de vida como empresa, ya cuenta con los primeros en adoptar. Y frente a lo que cabría suponer, no son solo administraciones públicas. Consultoras IT y fabricantes de hardware muy potentes ya se nos han acercado al ver que representamos un cambio tan grande como el que se dio entre el VHS y el Blue https://www.businessinsider.es/creo-primera-tarjeta-credito-historia-675313" Así se creó la primera tarjeta de crédito de la historia: una billetera olvidada inspiró a un empresario de Nueva York. Muchos fabricantes de hardware ya están pensando en sustituir la tecnología remarca Morró. Y el contexto es el propicio. Muchos fondos de recuperación europeos se van a destinar a la cultura y a la justicia, y una asignatura pendiente en muchos archivos es la digitalización de fondos. La caligrafía no es en ningún caso un obstáculo para la inteligencia artificial de Transkriptorium. Trabajamos con textos en hebreo, en latín, en austríaco, en bengalí, en francés, en checo. No tenemos una limitación con los idiomas. Podemos indexar la caligrafía procesal encadenada, cuando en el siglo XV los monjes españoles escribían sin separar las palabras hasta que se les agotase la tinta de la, remarca el CEO. https://www.businessinsider.es/grafico-rutinas-diarias-personajes-famosos-historia-670647" Una infografía compara las rutinas de 26 personajes históricos como Picasso, Mozart y Darwin para descifrar qué tuvo su éxito en común. Su modelo le permite a la IA aprender cualquier escritura con apenas 5.000 palabras. Un empujón que permitirá digitalizar buena parte de la historia de la humanidad que todavía no había llegado a la red, y gracias en buena medida a una tecnología netamente española





Read more...

Presentación Virtual del nuevo director del Archivo General de la Nación Pablo Fontdevila

La referente de Cultura participó de una reunión virtual con autoridades del Archivo General de la Nación
http://agenciasanluis.com/

Autor: Prensa Programa Cultura.

La referente de Cultura del Gobierno provincial, Silvia Rapisarda, mantuvo un encuentro virtual este miércoles 24 de febrero en horas de la mañana en la sala de reuniones del edificio Cultura, donde compartió junto a las demás provincias la presentación de Pablo Fontdevila como nuevo director del Archivo General de la Nación (AGN).

De la reunión participó además la jefa del Subprograma Patrimonio Histórico Cultural, Patricia Perkman, quien comentó sobre la agenda de actividades de la reunión como la invitación a la conmemoración de los 200 años (AGN) a cargo de Julia Rosemberg, entre otros.

Perkman destacó que de este encuentro participaron los Archivos Históricos de todas las provincias. San Luis estuvo presente para compartir la agenda de los temas del día, que fueron: brindar información sobre la Diplomatura en Archivística y Gestión Documental en modalidad a distancia (UNTREF-AGN) a cargo de su coordinadora, Paula Hrycyk, además de la invitación y propuesta de acompañamiento para la adhesión de los archivos provinciales al Sistema Nacional de Documentación Histórica (MINCYT) a cargo de Gabriela Parra (Archivo Histórico de la Provincia de Córdoba).

Otro de los temas desarrollados fueron los avances sobre protocolos de atención a la consulta presencial en el marco del COVID-19 (seguridad e higiene) a cargo de Natalia Villegas (Archivo Histórico de Rio Negro), la recopilación de normativa en archivos a cargo de Guillermo Clarke (Archivo Histórico Provincia de Buenos Aires, Dr. Ricardo Levenne) y la presentación de resumen y objetivos de la nueva ley de archivos de AGN.

Por último, en el cierre del encuentro se habló de los avances sobre Normalización Archivística hacia códigos de referencias nacionales a cargo de Paula Bertini (Archivo y Biblioteca Históricos de Salta) y la presentación de los avances que realiza la AGN en Directrices de Normalización Archivística, a cargo de María Ximena Iglesias.

San Luis participó de una reunión virtual con autoridades del Archivo General de la Nación. Fue este miércoles 24 de febrero en horas de la mañana.






 


Read more...

Traducir Audio a Texto

>>  miércoles, 24 de febrero de 2021

Cómo utilizar el Traductor Google para convertir audio a texto
https://www.adn40.mx/

Autor:  Redacción ADN40

El traductor Google trae una nueva función que puede revolucionar la comunicación, pasar de audio a texto en diferentes idiomas y en tiempo real

El traductor Google ya se adelantó para la próxima temporada de turismo internacional. Apenas las habiliten los viajes, luego de la Pandemia, podrás usar la nueva función para convertir audio en otro idioma a texto y viceversa. La nueva función permitirá ampliar el uso para diferentes campos, como podría ser una conferencia de prensa.

Los usuarios que tengan sistema Android en sus teléfonos móviles ya pueden utilizar la voz para convertirla en texto en el idioma que elijas.

De qué se trata la función que trabaja con texto y audio

A través de inteligencia artificial, y con el acceso al traductor Google es posible mantener una conversación medianamente fluida con un interlocutor en cualquier parte del mundo.

Ya que la nueva función permite transcribir tanto lo que dice la otra persona, en su idioma de origen, como lo que nosotros queremos comunicar.

El nuevo modo Transcripción, no solo permite la conversación entre personas, está enfocado también en conferencias y alocuciones en otros idiomas. De esta forma el traductor Google permite pasar el audio solo en texto, sin interrupciones en tiempo real.

Puedes modificar ciertas características de la función como:

El tamaño del texto.
Decidir si mostrar o no la transcripción en su idioma original.
Cambiar la apariencia de la interfaz.

Cómo utilizar la función del traductor Google, para pasar de audio a texto

Google 
La nueva función de Traductor Google para pasar de audio a texto en tiempo real

Al igual que todas las funciones de Google, suelen ser muy intuitivas, pero de todas formas los pasos a seguir son los siguientes:

Abre el traductor de Google. Si en tu caso el traductor Google ya activó la función de transcribir, tendrás el botón justo debajo del cuadro de texto, a la derecha de ‘Conversación’.

Al tocar en ‘Transcribir’ podrás seleccionar el idioma de origen y el de destino que se verá en texto.

Para probar la función habla al teléfono y Google Translate irá convirtiendo en tiempo real las palabras a texto.

En la configuración estándar lo que digas en audio se transcribirá ya traducido, pero puedes cambiarlo al idioma con la opción ‘Mostrar texto original’.

En la pestaña de ajustes puedes cambiar el tamaño del texto transcrito.

Si quieres comenzar a probar esta función del traductor Google, y pasar de audio a texto en otro idioma, simplemente abre la aplicación. En principio estará disponible solo en inglés, francés, alemán, hindi, portugués, ruso, español y tailandés. Pero irá sumando nuevos.

Read more...

Delitos Informáticos: Los Archivos de Vídeo como prueba de delitos

La Policía prueba que vídeos de Podemos usados para justificar los pagos de Neurona son de 7 años antes
https://okdiario.com/

Autor: Teresa Gómez y Fernán González

La Unidad Central de Ciberdelincuencia de la Policía Nacional ha analizado el material entregado por Podemos para justificar los 430.000 euros de los fondos electorales desviados a Neurona para, supuestamente, dar un servicio durante la campaña electoral de 2019. En el informe al que ha tenido acceso OKDIARIO, los investigadores concluyen que parte del material proporcionado por la formación morada al juez fue creado siete años antes de las generales del 28 de abril de 2019. Además, aparecen en buena parte de los vídeos, documentos e imágenes aparecen como “autores” personas que no trabajan en la consultora chavista.

El informe, de 47 páginas, concluye que “se han analizado un total de 709 imágenes, 304 vídeos y 69 documentos”. Con respecto a las imágenes: 6 imágenes fueron creadas en 2012; 6 en 2016; 85 en 2018; 525 en 2019; y 10 en 2020. Con respecto a los vídeos, aparecen dos de ellos realizados en abril de 2018, un año antes de las elecciones. Y también aparecen documentos creados en 2016, 2018 y 2020.

Los agentes explican que la mayoría del material se realizó en el año 2019, pero subrayan que se “ha observado que la mayoría de archivos han sido modificados entre los meses de marzo y abril de 2019. Cabe reseñar que, si un archivo no se modifica posteriormente su creación, la fecha de modificación coincide con la de creación”.

Informe de la Policía.
Informe de la Policía.
Sobre los autores de los vídeos, documentos e imágenes, el informe técnico detecta a agunas personas que no son trabajadoras de Neurona. “Se procede a detallar a continuación el nombre de usuarios que se repiten en cantidad superior a 5 veces y que no son nombres informáticos genéricos:

– “alejandro Neira”, aparece 68 veces en imágenes y 5 veces en videos

– “VicenteCamu”, en 9 ocasiones en archivos de vídeo

– “Waldemar AB,” aparece 3 veces en imágenes y 31 veces en documentos.

– “Waldemar AB” aparece 35 veces en imágenes.

-“javiivanyez”, aparece en 28 ocasiones en archivos de video.

-“Patricia Pinta Sierra”, aparece 19 veces en documentos.

Esta última trabaja en el Congreso de los Diputados según su perfil de Linkedin. Javier Ivanyez es un periodista fundador de la plataforma «Eh! Universo». Por lo que ninguno de los dos trabajan para la consultora chavista Neurona.

Creado en Latinoamérica

En el informe, los investigadores señalan que en los metadatos de los vídeos entregados por Podemos –para justificar que Neurona realizó un trabajo durante la campaña electoral de 2019– aparece que la mayoría han sido creado en América. Un hecho significativo si se tiene en cuenta que los actos de campaña tuvieron lugar en España y que supuestamente, según la versión de los miembros de Podemos imputados en el caso Neurona, un «equipo de trabajadores de la consultora se trasladó a Madrid para cubrir los eventos electorales».

Los policías explican: «Del análisis de estos datos se puede observar que, tanto en las imágenes como en los vídeos, principalmente en las fechas de creación, existen un elevado número de archivos con huso horario -07:00 y -05:00. Cuando se encuentran estos husos horarios en los archivos analizados, que corresponden con horarios del continente americano, están siempre asociados a ciertas cámaras concretas. La cámara Canon EOS 5D Mark III para el huso horario -07:00 y cámara NIKON D600 para el huso -05:00».

Read more...

Cómo transcribir un audio a formato texto de forma automática

>>  martes, 23 de febrero de 2021

Cómo hacer una transcripción de audio a texto (online y gratis)
https://elandroidefeliz.com/

Autor:  elandroide


Cómo transcribir un audio a formato texto de forma automática

La mayoría de aplicaciones de software que realizan este tipo de conversiones suelen ser de pago, y lo cierto es que no resulta sencillo encontrar una solución que te permita hacer la transcripción sin dejarte una pequeña suma de dinero por el camino. Algo que da bastante rabia, especialmente, si solo necesitas hacer una transcripción de manera puntual.

Actualmente existen varias herramientas de reconocimiento de voz que pueden cumplir esta función de gratuitamente, pero la mayoría -como las APIs desarrolladas por Google y Amazon– son utilidades para desarrolladores y no se pueden utilizar de manera independiente. Por suerte, todavía quedan alternativas que merecen bastante la pena, como por ejemplo, Otter.ai.

Transcripción online automatizada y gratuita con Otter.ai

Otter.ai es una aplicación web que te permite hacer transcripciones de audio a texto de manera automática. Todo online y desde el navegador, sin necesidad de instalar nada en tu equipo. Se trata de una herramienta de pago, aunque también ofrece un plan gratuito que nos permite transcribir a texto un máximo de 3 archivos de audio o video. Aparte de esto, la única limitación es que los archivos no pueden tener una duración de más de 40 minutos.

Si lo único que necesitas es hacer una transcripción de manera puntual resulta realmente práctico, ya que Otter.ai es capaz de identificar las diferentes personas que están participando en el audio y separar las intervenciones de cada uno de los oradores para entregar un texto claro y ordenado.

A mi personalmente os puedo asegurar que me ha salvado la papeleta, y debo admitir que el nivel de la transcripción también es bastante bueno. Si quieres probarlo por ti mismo tan solo tienes que seguir estos pasos:

Lo primero que debes hacer es entrar en https://otter.ai.
Inicia sesión o regístrate. Puedes crear una cuenta nueva o usar tu cuenta de Google, Microsoft o Apple.
Una vez dentro del panel principal de la aplicación, pulsa sobre la opción “My conversations” que verás en el menú lateral.


A continuación, añade la pista de audio o video que quieres transcribir pulsando sobre “Import audio/video”.


Arrastra el archivo de audio a la ventana que acaba de abrirse o haz clic sobre el botón “Browse file” para seleccionar el archivo manualmente.

Una vez procesada la carga del archivo pulsa sobre “Done”. La aplicación también te dará la opción de avisarte cuando la transcripción se haya completado. Mientras tanto, verás que el audio está siendo tratado porque justo debajo del mismo aparece el mensaje “In Processing”.


El proceso de conversión a texto puede durar entre 5 y 10 minutos, dependiendo de la duración del audio. Una vez finalizado haz clic sobre la conversación para verla en formato texto.

Tal y como vemos en el pantallazo superior la aplicación es capaz de distinguir los diferentes participantes, separándolos por colores para evitar perder el hilo de la conversación. Así mismo, también tenemos la posibilidad de reproducir el audio que corresponde a cada parte del texto para revisar la transcripción y detectar errores.

Por último, también podemos exportar el texto pulsando sobre el botón de 3 puntos que veremos en la zona superior derecha de la pantalla. Seleccionamos “Export text” y elegimos el formato TXT o copiar en el portapapeles. Si optamos por la versión premium de Otter.ai también podremos exportar la transcripción a otros formatos como DOCX, PDF y SRT.

En definitiva, una herramienta de lo más funcional y una de las mejores formas de transcribir archivos de audio o video a formato texto de forma automática sin necesidad de rompernos mucho la cabeza. Siempre hay algunas palabras que no las identifica bien y sin duda te tocará hacer alguna que otra corrección, pero en líneas generales es una solución realmente eficaz y de lo más recomendable.

Read more...

La historia en el archivo: El sumario del 23-F, 89 legajos entre tomos, grabaciones, cintas y expedientes

El sumario del juicio del 23-F, junto al del 11-M en el depósito acorazado del Tribunal Supremo
https://www.niusdiario.es/
Autor: Nuria Lázaro



Los 89 legajos que ocupa toda la causa incluyen los tomos del juicio en el Consejo Supremo de Justicia Militar, el recurso de casación en el Tribunal Supremo, grabaciones, cintas y la petición de indultos

El juicio contra los golpistas comenzó el 19 de febrero de 1982, un año después del golpe, contra Antonio Tejero y otros 32 procesados

Se cumplen 40 años del intento de golpe de Estado del 23-F. Aunque tengas menos de 40 años a buen seguro que la fecha te trae a la memoria una frase: "Quieto todo el mundo". Las imágenes de un grupo de guardias civiles las habrás podido ver en algún momento, y de este acontecimiento "histórico" se ha escrito mucho. Historiadores, escritores, políticos, analistas... han dado cuenta de su particular 23-F.

Hay además otros muchos que llevan desde entonces solicitando que se desclasifiquen los documentos que los servicios secretos elaboraron de ese hecho. Pues bien, uno de los documentos, que incluye cintas, expedientes y grabaciones, está ahí, al alcance de un permiso no difícil de conseguir: el sumario integro del juicio del 23-F. Los hechos acreditados por una veintena de jueces de lo que pasó ese día y que delimitó las responsabilidades judiciales por el alzamiento militar.

El sumario del 23-F se conserva en el depósito acorazado del archivo central del Tribunal Supremo, en la madrileña plaza de Villa de París. El antiguo convento de las Salesas Reales convertido en tribunal en 1878. La institución guarda en ese mismo archivo otros expedientes con valor histórico como el de los atentados del 11-M o el apuntamiento de la causa del general Prim.

89 legajos entre tomos, grabaciones, cintas y expedientes

El archivo está compuesto por un total de 89 legajos, que incluyen la causa original que se instruyó y enjuició en el Consejo Supremo de Justicia Militar, el recurso de casación tramitado en el Tribunal Supremo, los expedientes personales de los procesados, grabaciones y cintas, los expedientes de indulto y las piezas separadas.


Solo la causa original procedente del Consejo Supremo de Justicia Militar ocupa 17 legajos, que equivalen a 43 tomos (12.854 folios).


Además del expediente que se encuentra en el depósito acorazado con los documentos originales, el Tribunal Supremo ha digitalizado toda la causa.


El sumario del 23-F es accesible en los términos fijados por el artículo 235 de la Ley Orgánica del Poder Judicial, que establece que “los interesados tendrán acceso a los libros, archivos y registros judiciales que no tengan carácter reservado, mediante las formas de exhibición, testimonio o certificación que establezca la ley”.


Desde su depósito en los archivos del Tribunal Supremo, más de una decena de personas han sido autorizadas por la Sala de Gobierno del alto tribunal para consultar el sumario con fines de investigación histórica y/o periodística.

Read more...

Reinician actividades 636 archivos históricos, bibliotecas y galerías en CDMX

https://noticiasporelmundo.com/
Autor: La Prensa MX

Desde este lunes regresaron a la actividad en la Ciudad de México, 271 bibliotecas y archivos históricos, junto a 365 galerías para venta de arte, que conjunto regresarán a laborar aproximadamente 4 mil 350 personas, así lo informó la Secretaría de Desarrollo Económico (SEDECO).


Sobre el tema, el titular de la SEDECO, Fadlala Akabani Hneide, mencionó que, con el regreso de estos establecimientos dedicados al esparcimiento, divulgación del arte y la cultura, poco a poco y de manera responsable son más los sectores de todo tipo de giros no esenciales que se agregan a la dinámica económica de la Ciudad.

“La apertura de bibliotecas, archivos históricos y galerías para venta de arte, es un magnífica noticia para la economía, por ejemplo las galerías son espacio de venta para muchos artesanos y artistas jóvenes, que nuevamente tendrán un espacio para comercializar su trabajo, al mismo tiempo que la ciudadanía podrá disfrutar de la historia y conocimiento albergado en las bibliotecas y archivos históricos que tiene la capital” indicó.

El funcionario detalló que las 636 unidades económicas que conforman los archivos históricos, bibliotecas y galerías ara venta de arte, deberán de seguir rigurosamente las medidas sanitarias que ha dispuesto el Gobierno de la Ciudad de México para poder operar, entre las que destacan la utilización de un sistema de citas y el uso riguroso de cubrebocas.

La SEDECO invita a todos los establecimientos que reinician operaciones a registrar sus actividades y cumplir con las medidas sanitarias de protección a la salud, en la página: covid19.cdmx.gob.mx/medidassanitarias

Read more...

Snap Shots

Get Free Shots from Snap.com

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP