martes, 19 de junio de 2012






El resumen en el mundo de los RSS.



Resumen documental.

Dado al gran volumen de documentos de todo tipo se hace necesario que el contenido básico del documento sea identificado de la manera más rápida posible, por lo que el resumen nos da una serie de ventajas que expresare a continuación y nos ayudan en el proceso de gestión de dicha documentación.

  • Resumir nos permite disminuir el volumen de información primaria y destacar los aspectos que tienen interés para el usuario.
  • Facilita información condensada del contenido de un documento.
  • No es una enumeración de ideas esenciales, se trata de la representación o reconstrucción de ese texto.
  • Se usa el lenguaje natural aunque sufriendo modificaciones.
  • Es necesario conocer el documento a resumir para realizar un buen resumen.

Dentro del proceso de investigación así como del proceso de la navegación diaria el tiempo en búsqueda de información se hacia cada vez mayor debido a las nuevas tecnologías, de esta formas se decidió que la inclusión de los resúmenes en los documentos generados era de gran utilidad y totalmente necesaria para facilitar la investigación y ayudar a la recuperación documental.

La entrada del resumen en los RSS se explica de forma que los RSS son archivos de formatos XML o RSS que son simples archivos de texto donde aparece referencias a contenidos publicados en un formato especifico, de tal forma que los resúmenes entran dentro de los RSS gracias a la función que ejercen de sintetizar el contenido de los documentos originales para mandar un resumen en esos archivos XML o RSS.

http://www.ucm.es/info/multidoc/prof/periodismo/Curso2004_tem_periodismo14.htm

Definición de RSS.

RSS significa Really Simple Syndication (Sindicación Verdaderamente Simple). Trata de que los navegantes se inscriban gratuitamente a las páginas webs de su preferencia, recibiendo las últimas actualizaciones y la información mas reciente. Esas actualizaciones se llaman Feed.

Los RSS nos permiten reunir las noticias, información u otros contenidos de las webs y weblogs que más nos interesan en un programa que se llama agregador, o lector de RSS, y nos permite consultarlas de manera rápida, sin necesidad de ir página por página buscando novedades.

Como funcionan los RSS.

Los RSS funcionan de forma inversa a los buscadores convencionales, de tal forma que en este caso la información va hacia nosotros sistematizando y organizando nuestro acceso a dicho recurso.
Con su uso se puede monitorizar toda la información que nos interese tanto a nivel personal como profesional. Nosotros ya no tendremos que buscarla, esta viajara a nosotros.

Los RSS son un formato de documento que esta basado en el XML conforme especificaciones publicadas por el W3C. Constituyen una familia de documentos tipo para actualizar las novedades de un sitio web , los documentos generados son enviados a un RSS reader denominado agregador, aunque hoy en día esos agregadores pueden ser también browsers de navegación.

La utilización de los RSS se hace de forma muy sencilla, simplemente activando tu lector de RSS y
y pulsando los botones de RSS de la pagina de la que quieras estar informado.

El RSS no resume el recurso sino que recoge una serie de datos o información de tal forma que el lector sea capaz de interpretarlos. El resumen o no de los contenidos dependerá de al fuente en la que se haya establecido el RSS.

En los casos en los que se puede saber de forma fidedigna que el emisario ha entregado un resumen fiable sobre el contenido de los artículos principalmente es en las revistas científicas o revistas que han establecido un patrón de resúmenes normalizado.





Ventajas e inconvenientes de los RSS.

Ventajas:
  1. Centraliza la información de nuestro interés en un único sitio web, evitando la perdida de tiempo de el uso de varias fuentes.
  2. Ahorro de tiempo y dinero ya que esta información te mantiene al día constantemente y sin perdidas de tiempo.
  3. Posibilidad de montar vigilancia tecnológica a bajo coste.
  4. Posibilidad de redistribuir la información, seleccionando la información mas adecuada para cada persona.
  5. Selectividad y fiabilidad, ya que la fuentes escogidas serán elegidas con por sus características principales.
  6. Facilidad de uso y gestión.
  7. No es difícil darse de baja de los RSS.
  8. Se puede usar como herramienta de Marketing para la expansión de sitios webs.
  9. Disminuye el desorden en tu bandeja.

Inconvenientes.

  1. Necesidad de búsqueda de las fuentes de información en un primer momento y constante actualización en los campos de interés ante nuevas posibilidades.
  2. Alta posibilidad de Infoxicación (abuso de los RSS y spam de información)
  3. Opacidad de algunas fuentes secundarias.
  4. En al selección de keywords es clave la exhaustividad o precisión para evitar el ruido documental.
  5. No suelen aparecer gráficos y fotografiás en muchos de los RSS.






Tipos de lectores RSS.

  • Lectores RSS en local. Programas que se instalan en el ordenador y permiten el acceso local. RSS Bandit, News gator o RSS Owl.
  • Lectores RSS Online. Paginas web desde las que puedes leer los RSS, como pueden ser Google Reader o Bloglines.
  • Lectores RSS en el navegador web o programa de correo electrónico. Se reciben las actualizaciones a través de el navegador web o a tu propio correo electrónico. Esta funcionalidad la tienen navegadores como Internet Explorer o Mozilla Firefox y también Outlook.



Otras herramientas de Sindicación.

  • Atom Es una herramienta de sindicación que no usa RSS. Si usa la herramienta para bloguear, Blogger automáticamente se crea un feed de tu blog en un formato Atom.
  • Feedburner: Es un administrador de feeds. Propiedad de la compañía Google. Permite crear un feed adecuadamente y promocionarlo pudiendo postear un los XML o TSS en tu blog para que los usuarios se suscriban a el.
  • Twitterfeed: Envia directamente tus actualizaciones a tus redes sociales (Twitter, Facebook y Linkedin) sin tener que hacerlo manualmente.






La indización en el infoescenario actual: El etiquetado social.


El etiquetado social está basado en la colaboración de las personas, las cuales a través de palabras claves “tags” describen y organizan sus paginas web, esto permite guardar, administrar y compartir su lista de enlaces desde cualquier ordenado conectado a Internet.
El resultado de este proceso de clasificación libre se llama folksonomía y tiene estas características.

  • Se trata de un metadato externo que se añade a un objeto o a su representación.
  • Se usan términos libres, no provenientes de vocabularios controlados.
  • Se usan para ordenar, organizar, agregar y recuperar información.
  • Incorpora Información sobre diferentes aspectos: identificación temporalidad, descripción localización...
  • Sirve como marcador personal.

La acción la lleva a cabo la persona que localiza, selección y utiliza la información y este etiquetado se realiza sobre contenidos aportados por otro usuarios en una plataforma social en la que participan otros usuarios, otros usuarios pueden extender y compartir el significado y el contexto del usuario que etiqueta sin suponer un esfuerzo extra en los procesos cognitivos del usuario.

Entornos de aplicación del etiquetado social.
  • Sistemas de gestión de contenidos: Blogs, medias, marcadores...
  • Facetas.
  • Filtrado.
  • Búsqueda social.
  • Información semi-estructurada.
  • Recuperación de información.

También existen las nubes de etiquetas, que te permiten a través de representaciones gráficas de etiquetas identificar las principales áreas de interés o trends o los términos mas usados, se usan ya en sitios como Youtube, Flickr y Delicious.

Ventajas del etiquetado social.

  1. Sistema de clasificación abierto y democrático.
  2. Enlaces disponibles desde cualquier fuente con Internet.
  3. Integración de los RSS en las etiquetas para mantener su actualización.

Desventajas.

  1. Los sistemas de clasificación se pueden ver obsoletos demasiado pronto.
  2. El enfrentamiento con los problemas lingüísticos y la falta de control de la información etiquetada.
Fuentes:


Video Ilustrativo.

Diseño y construcción de sistemas de indización.


El término indización explica el proceso de describir o representar el contenido temático de un recurso de información, lo cual nos facilita un índice de terminos de indización que se utilizaran como herramienta de búsqueda y acceso al contenido de recursos en sistemas de recuperación de información.
LA indización se trata de una actividad técnica-intelectual con el objetivo de hacer posible el almacenamiento, recuperación , acceso y difusión de la información. Y consta de cuatro etapas:

1. Revisión del contenido del documento.
2. Selección de los conceptos.
3. Traducción de los conceptos en descriptores.
4. Establecimiento de enlaces sintácticos entre los descriptores.

Paradigmas y plataformas teóricas en el desarrollo de una ciencia. Biblioteconomía y Documentación
Existen dos tipos de indización claves dentro del mundo de la Biblioteconomía y la documentación que hacen un antes y un después dentro nuestro campo. En el momento en el que aparecen los medios técnicos y automatizados dentro de nuestro campo, se puede hablar de una indización automatizada totalmente diferente a la anterior con los que se puede relacionar que en un principio existía un tiempo de de indización basado en técnicas establecidas por los principios básicos de la archivística y la biblioteconomía que procuraban unos procesos manuales y menor organización del sistema. Ahora, la indización se relaciona con los procesos de arquitectura de la información y por lo tanto supone un cambio total a lo anteriormente establecido en principios básicos de nuestro campo.

El conocimiento como referente básico para el desarrollo de teorías y métodos para la construcción de sistemas conceptuales de indización

La indización al tener la función de descripción y y representación de un contenido (búsqueda y creación de descriptores), debe desarrollar teorías y métodos que ayuden mejorar la relación existente entre los documentos o datos que se intentan indizar y los usuarios y con ellos procede a la creación de un nuevo conocimiento que sirve de enlace entre los mismos.




Modelos teóricos generales en Biblioteconomía y Documentación ( Físico, Cognitivo y Socio cognitivo).

Modelo Físico: se basa en que el conocimiento esta en un mundo reál, en el objeto, evitando contaminaciones del ambiente se procura buscar una experiencia de indización sacada del objeto real.

Modelo cognitivo: Es de una tendencia del subjetivismo y se basa en la creencia de que el sujeto es el creador del conocimiento y no el objeto lo cual crear un cambio total al anterior método físico.

Modelo Socio Cognitivo: Se interesa por el individuo y los sistemas expertos y se basa en la idea de que la trascendencia del momento en la que viva la persona encargada de la indización marcara el sentido de la la indización en si misma.

La representación del usuario en la recuperación de información: http://www.ciepi.org/fesabid98/Comunicaciones/mj_lopez/mj_lopez.htm


Otros métodos para la construcción de sistemas de indización.

Métodos lingüísticos: Con la entrada de la indización automática se contribuyo a la idea de que las técnicas tradicionales se cambiarían y se produjeron una serie de ensayos como nuevos métodos no lingüísticos entre los que destacan: Frecuencia, Probabilidad, Clustering, Valores de discriminación, Relevancia de los términos, Imitación de la indización humana, INDEXD, SAPHIRE y la experiencia en la NASA.

Método no lingüístico: A partir de los años cincuenta se desarrollan investigaciones que se ligan principalmente con la lingüística formal y las ciencias de la computación. Sistema SMART, Sistema CLARIT y el Proyecto SIMPR.

jueves, 12 de abril de 2012

Análisis del aprendizaje

Tras la realización de los respectivos trabajos por cada uno de los grupo, llega la hora de realizar una reflexión sobre lo aprendido en esta etapa y ademas sobre como estos trabajos forman parte de el temario de la asignatura.

En primer lugar cabe destacar que estos trabajos principalmente nos muestran como los sistemas de indización pueden participar como herramientas 2.0 en Internet y ademas como se pueden adaptar a las distintas redes sociales de tal forma que el universo 2.0 y las redes sociales se vean envuelto del orden y las capacidades favorables de dichos sistemas de indización, ademas nos permite ver la limitaciones que presentan las diferentes redes sociales y las posibles practicas que se pueden realizar para mejorar dichas redes sociales como hemos ido haciendo los diferentes grupos, con todo esto se puede ver que los tema 1 y 2 del temario han sido altamente representado viendo las oportunidades de los sistemas de información en las redes sociales y mas concretamente las funciones y la capacidad que tienen en el entorno 2.0 a la hora de interactuar con el publico demandante.

En un segundo grupo entran los temas del temario del 3 al 6 que tratan sobre los tesauros, estos temas se han visto totalmente reforzados con las explicaciones de los diferentes trabajos a la funcionalidad de los tesauros dentro de las redes sociales, así como las explicaciones que debíamos de hacer de como los usuarios participaran en las redes sociales, de como estos tesauros se deben usar y los diferentes manuales que se han ido creando para la realización de un correcto tesauro. En esto manuales hemos tenido que explicar los principios de los tesauros, las características, su estructura, tipologías de tesauros, y ademas como sera su adaptación al entorno web, en el caso de mi grupo en concreto la adaptación a la red Linkedin.

Por último en la mayoría de los trabajos también se ha estudiado la forma en que los tesauros y los sistemas a implantar en estas redes sociales deben realizar resúmenes o sistemas de etiquetas para la entrada de los datos en los tesauros, de esta forma se puede concluir que todo el temario de la asignatura ha sido claramente estudiado durante estos trabajos y adaptado de una forma practica en las redes sociales, las cuales suponen el mayor representante de el entorno 2.0.

Dentro del trabajo y el temario se puede resumir todo en tres puntos definidos:

  • Concepto 2.0. y sistemas de indización que han sido tratados durante el trabajo.
  • Elaboración y implantación de un tesauro dentro de una red social y explicación de su funcionamiento.
  • Realización de una explicación sobre los diferentes etiquetados o sistemas de resúmenes obligatorios para la implantación del tesauro.

Bibliografía.


jueves, 10 de noviembre de 2011

Tools4Noobs, Herramienta de Indización y Resumen.


Tools4noobs Esta página Web nos presenta una serie de herramientas que permite el resumen y la extracción de palabras claves de documentos en concreto. Esta pagina, en concreto lleva al día las nuevas tecnologías en la automatización de resúmenes, con ello podemos obtener unos resúmenes, o líneas mas importantes de un texto que por alguna razón u otra no tengamos tiempo de hacer por nosotros mismo o se quiera ver como seria su resumen automático.

¿Cómo utilizarla? Esta herramienta es totalmente On-line por lo tanto el uso de ella simplemente seria dirigiéndose a la url correspondiente y poniendo el propio texto o simplemente copiando la url con el texto que se quiera extraer el resumen.
¿Tiene otros usos? La extracción de la palabras clave también entra dentro de las posibilidades que presenta esta herramienta, ademas especificando tanto el numero de palabras que deseas como el numero de veces que aparece cada palabra en el texto, Con ello tendremos una herramienta de indización bastante lógica y clara a la hora de  poder realizar un orden en los documentos y todo de forma gratuita y rápida.

Esta herramienta en cuestión de resúmenes también tiene una función que es bastante útil y además te abre un abanico a la hora de la restricción en los resúmenes, y es que tu puedes escoger el porcentaje de umbral que quieres que sea un resumen. Con esta opción seremos capaces de informar a la maquina como queremos que res de restrictivo en nuestro resumen, si queremos un resumen amplio pondremos un umbral bajo de restricción y si queremos un umbral alto con lo cual un resumen corto y conciso pondremos un porcentaje bastante alto.

Quizás los únicos dos inconvenientes que le puedo encontrar a esta herramienta es que en la sección de palabras clave  no tiene muy en cuenta la palabras vacías, por lo tanto te puedes encontrar que algunas palabra como pudiera ser “esta”  aparecen dentro de estas palabras clave, pero aun así con ampliar el numero de palabras clave el problema se vería solucionado.

Por otro lado el otro problema que veo es el de la confianza hacia el producto, al ser un producto gratuito On-line y que  no posee un gran prestigio debes de depositar tu confianza en que el resumen que te vaya a facilitar este bien hecho y que además  te de las partes importantes del texto, pero entrando en la filosofía de las herramientas de la web 2.0  esta confianza entraría dentro de al implícito en su uso, con lo cual si usas la herramienta es porque confías en ella.   


Enlaces: