Páginas

2013/05/17

Frecuencia de palabras de un texto usando Ruby (desde un archivo PDF)

Para aprender un idioma no cabe duda que primero hay que adquirir un buen vocabulario.
Estudié alemán en la universidad durante un semestre y siempre he echado de menos profundizar un poco más.
Se me presentó la duda de qué palabras eran más comunes en una lengua (dejando de lado las preposiciones) y en caso de ampliar mi vocabulario en una lengua extranjera porqué no ir aprendiendo aquellas que con más frecuencia aparecen en su literatura.

Así pues he escrito este script en Ruby que lee un pdf y extrae las frecuencias de repetición de sus palabras.
Nota: Se necesita instalar la gema pdf-reader (https://github.com/yob/pdf-reader)


2 comentarios:

  1. Y si mi entrada fuera un archivo de texto en vez de un pdf?

    ResponderEliminar
  2. Hola BioLab. Acabo de crear una nueva entrada: Frecuencia de palabras de un texto usando Ruby (desde un archivo de texto)
    http://17cosas.blogspot.com.es/2017/03/frecuencia-de-palabras-de-un-texto.html

    Un saludo.

    ResponderEliminar

MsiInv o cómo obtener información del software instalado en tu ordenador (en Windows)

Pues como dice el título, si quieres saber realmente qué software tienes instalado en tu computadora con el sistema operativo Windows, recom...