Hace 17 años | Por ghost a mundobip.com
Publicado hace 17 años por ghost a mundobip.com

Google va a patrocinar el desarrollo de un OCR Open Source. El proyecto tiene como objetivos avanzar en el reconocimiento óptico de caracteres y tecnologías relacionadas para ofrecer un sistema OCR de alta calidad que permita usarlo para la conversión de documentos, para crear librerías electrónicas, ofrecer un mejor soporte para disminuidos ópticos, en análisis de documentos históricos y para el uso de escritorio en general.

Comentarios

g

Porque uno está en castellano y el otro en ingles?

padre

¿por qué no enlazas mejor a http://google-code-updates.blogspot.com/2007/04/announcing-ocropus-open-source-ocr.html ? ¿o te viene mejor enlazar al foro @ghost ?

sorrillo

#6 Quizá ? es lo mas probable pero eso no le quita ni mérito ni valor.

El riesgo de hacerlo Open Source es que cualquiera puede usarlo, incluso la competencia.
La ventaja del Open Source es que cualquiera puede mejorarlo, incluso la competencia.

A mi me dan igual los oscuros motivos que pueda tener una empresa, cualquiera, para desarrollar en open source con licencias libres. El beneficio es el mismo tanto si la empresa lo hace por su bien o por lo de los demás.

sorrillo

Can it be used for detecting image-based spam?

Yes. Right now, it will work about as well as Tesseract for that purpose. We hope to improve performance further in the future.

Jur jur jur, empiezo a entender porqué el antispam de Google es casi infalible

blid

#15 Sacado de la OpenSource Initiative www.opensource.org

Punto 3 - Derived Works
The license must allow modifications and derived works, and must allow them to be distributed under the same terms as the license of the original software.

Consecuencia del punto 2 - Source Code
The program must include source code, and must allow distribution in source code as well as compiled form. Where some form of a product is not distributed with source code, there must be a well-publicized means of obtaining the source code for no more than a reasonable reproduction cost preferably, downloading via the Internet without charge. The source code must be the preferred form in which a programmer would modify the program. Deliberately obfuscated source code is not allowed. Intermediate forms such as the output of a preprocessor or translator are not allowed.

sorrillo

#12 Tus paranoias están fuera de lugar en este caso. Estamos hablando de Open Source, da igual lo que quiera o no quiera hacer google con este software mas adelante, seguirá siéndolo.

pinar

Yo soy de los que creen que es spam, pero ya he meneado

Aún así me parece realmente interesante. Hay textos que no se pueden encontrar por la red y si quieres tenerlos en el ordenador hay que escanearlos. La putada es que no puedes hacer búsquedas de palabras en esos textos.

c

A mí me ha parecido útil, mejor el enlace a su información que a la en inglés.

sorrillo

#15 Enhorabuena. Acabas de demostrar que no te has leído la noticia.

Licencia: Apache License 2.0

Y no me vengas con chorradas académicas, estamos hablando de Google y estamos hablando del OCR y por lo tanto si alguien hace referéncia a Open Source también esta haciendo referéncia a Free Software, a Software Libre, etc.

g

Quizá lo que pretenda Google es avanzar tanto este OCR que lo pueda usar en su robot de búsqueda para así entender los textos en imágenes que hay por la red, o leer los textos de los PDFs que no están en texto sino en imagen.

g

#7 Yo estoy totalmente de acuerdo contigo, al hacerlo open source quizá otros desarrolladores les ayuden a mejorarlo, y a la vez, pueda usarlo más gente.

D

Yo uso ABBYY Fine reader 5.0, un programa de ese tipo que me trajo la impresora. Ojalá y pueda tenerlo en opensuurce algun día. Me necanta el opensource, pero mi a mi hermanito no le gusta openoffice.org. Pero me gustaría tener ese programa algún día.

m

#12 Yo estoy deseando que google siga creciendo y haciendo más cosas OS para poder incluirlas en mis programas.

De hecho necesitaba un OCR hace unos meses y busqué uno OS y lo poquito que encontré no era ni medianamente funcional. Estoy seguro que con esto podré retomar dentro de un tiempo mi idea gracias a este paso.

sw0r

No se, no se. Me parece que google empieza a hacerse demasiado grande y poderoso. No me cabe duda de que todas sus estrategias son para obtener una posición dominante en el mercado. ¿Llegará el día en que google decida que hay que pagar por sus servicios y dependamos tanto de él que no nos quede más remedio que tragar?

t

#13 Incorrecto. El software Open Source no implica que otra gente tenga permisos ni derechos para continuarlos, simplemente significa que se puede ver el código.