segunda-feira, 1 de maio de 2017

Brasileiros tentam decifrar misterioso Manuscrito Voynich

 Um dos maiores segredos da criptografia, o Manuscrito Voynich tem 16 cm de largura, 22 de altura e 4 de espessura. São 122 folhas, com um total de 204 páginas Manuscrito Voynich  Técnicas de física estatística estão ajudando a desvendar os segredos do Manuscrito de Voynich, um texto supostamente escrito antes do século 15 e descoberto em 1912.  Apesar das inúmeras ilustrações, ninguém sabe do que o livro trata porque linguagem é cifrada - as tentativas de decifrá-la tem ocupado os criptógrafos há décadas.  Uma análise feita por físicos brasileiros revela agora que os textos do Voynich não são um conjunto de palavras aleatórias e sem significado e de signos sem sentido, como muitos defendem - sobretudo porque até hoje ninguém conseguiu descobrir seu sistema de escrita.  Como as ilustrações encontradas na obra mostram plantas e corpos celestes, os pesquisadores brasileiros juntam-se ao grupo que defende que o livro que pode trazer informações valiosas sobre ervas e astrologia.  A contribuição da física veio com o uso de conceitos de redes complexas e séries temporais, além de estatísticas sobre as palavras no texto. Séries temporais mostram padrão de repetição de palavras no manuscrito  "Com a análise de séries temporais foi possível verificar a intermitência do uso de palavras no texto, ou seja, qual o padrão de repetição de uma mesma palavra ao longo do manuscrito", explica Osvaldo Novais de Oliveira Junior, professor do Instituto de Física de São Carlos (IFSC) da USP.  "Em outras obras literárias, conseguir identificar esse padrão de intervalos pode dar dicas sobre um autor ou sobre o assunto de um texto," completa ele.  Séries temporais e redes complexas  Para entender a aplicação de séries temporais na análise de textos, imagine que um livro tenha como tema ciências exatas e que seus primeiros capítulos versem sobre física e os últimos sobre matemática.  No começo, é provável que a palavra "relatividade" apareça com frequência, o que não ocorrerá nos capítulos finais, nos quais a palavra "geometria analítica", por exemplo, aparecerá mais vezes.  Outra abordagem importante para investigar o manuscrito de Voynich foi a de redes complexas, em que um texto é representado por uma rede na qual os nós são as palavras, e se estabelecem conexões quando duas palavras aparecerem juntas. Se houver muitas ocorrências dessas palavras, aumenta-se o peso da conexão.  "Das características da rede, de sua topologia, pode-se extrair informações importantes. Dentre essas características, estão quais palavras são mais conectadas, se há formação de aglomerados de palavras em comunidades, e qual é a distribuição de conexões entre as palavras no texto", elucida Oliveira Junior.  Texto real  Para ter certeza de que o texto do Voynich não se tratava de um texto de palavras ao acaso, os físicos o compararam com textos reais em várias línguas, e identificaram parâmetros das redes que permitem distinguir um texto aleatório de um texto real.  "Fizemos redes com textos reais de 15 idiomas e utilizamos mais de 20 métricas para verificar quais distinguiam um texto aleatório de um texto real. Dessa forma, conseguimos verificar que o Voynich não é um texto aleatório. Pretendíamos também identificar a qual idioma o Voynich é mais similar, mas a quantidade de dados de que dispúnhamos não foi suficiente para obter conclusões estatisticamente significativas. Infelizmente não há muitos textos traduzidos em diversas línguas que estejam disponíveis na internet," conta o professor.  Para identificar as palavras-chave do Voynich, os físicos verificaram nas métricas de rede e séries temporais quais palavras se sobressaiam. E para comprovar a razoabilidade da estratégia, foram utilizadas as mesmas táticas para textos de idiomas conhecidos.  "Utilizamos estratégias de controle, para saber se aquela metodologia era eficiente. No nosso caso, comparamos textos do Novo Testamento em 15 idiomas para identificar palavras-chave. Como a estratégia deu certo, ela também foi utilizada para detectar as palavras-chave do Voynich", afirma Oliveira Junior.  Linguagem do Voynich  A conclusão é que o manuscrito Voynich não é um texto aleatório, tendo sido provavelmente escrito em um idioma desconhecido, artificial.  Mais importante ainda é que as estratégias utilizadas pelos pesquisadores funcionaram bem, o que poderá dar pistas importantes aos futuros (e corajosos) decifradores do manuscrito.  O professor comenta que, embora a análise do misterioso Voynich tenha sido um dos alvos principais da pesquisa, as abordagens de física estatística e física computacional desenvolvidas podem ser úteis para muitas outras aplicações. O conhecimento gerado pode auxiliar na análise de grandes volumes de dados, inclusive de textos.  "Hoje, a maneira como uma máquina aprende é muito rudimentar, requerendo intensa participação de humanos. No futuro, será possível que o computador tome decisões de como aprender e fazer aquisições dessas informações, transformando-as em conhecimento, inclusive para ele próprio", avalia ele.  FONTE: USP
Um dos maiores segredos da criptografia, o Manuscrito Voynich tem 16 cm de largura, 22 de altura e 4 de espessura. São 122 folhas, com um total de 204 páginas
Manuscrito Voynich
Técnicas de física estatística estão ajudando a desvendar os segredos do Manuscrito de Voynich, um texto supostamente escrito antes do século 15 e descoberto em 1912.
Apesar das inúmeras ilustrações, ninguém sabe do que o livro trata porque linguagem é cifrada - as tentativas de decifrá-la tem ocupado os criptógrafos há décadas.
Uma análise feita por físicos brasileiros revela agora que os textos do Voynich não são um conjunto de palavras aleatórias e sem significado e de signos sem sentido, como muitos defendem - sobretudo porque até hoje ninguém conseguiu descobrir seu sistema de escrita.
Como as ilustrações encontradas na obra mostram plantas e corpos celestes, os pesquisadores brasileiros juntam-se ao grupo que defende que o livro que pode trazer informações valiosas sobre ervas e astrologia.
A contribuição da física veio com o uso de conceitos de redes complexas e séries temporais, além de estatísticas sobre as palavras no texto. Séries temporais mostram padrão de repetição de palavras no manuscrito
"Com a análise de séries temporais foi possível verificar a intermitência do uso de palavras no texto, ou seja, qual o padrão de repetição de uma mesma palavra ao longo do manuscrito", explica Osvaldo Novais de Oliveira Junior, professor do Instituto de Física de São Carlos (IFSC) da USP.
"Em outras obras literárias, conseguir identificar esse padrão de intervalos pode dar dicas sobre um autor ou sobre o assunto de um texto," completa ele.
Séries temporais e redes complexas
Para entender a aplicação de séries temporais na análise de textos, imagine que um livro tenha como tema ciências exatas e que seus primeiros capítulos versem sobre física e os últimos sobre matemática.
No começo, é provável que a palavra "relatividade" apareça com frequência, o que não ocorrerá nos capítulos finais, nos quais a palavra "geometria analítica", por exemplo, aparecerá mais vezes.
Outra abordagem importante para investigar o manuscrito de Voynich foi a de redes complexas, em que um texto é representado por uma rede na qual os nós são as palavras, e se estabelecem conexões quando duas palavras aparecerem juntas. Se houver muitas ocorrências dessas palavras, aumenta-se o peso da conexão.
"Das características da rede, de sua topologia, pode-se extrair informações importantes. Dentre essas características, estão quais palavras são mais conectadas, se há formação de aglomerados de palavras em comunidades, e qual é a distribuição de conexões entre as palavras no texto", elucida Oliveira Junior.
Texto real
Para ter certeza de que o texto do Voynich não se tratava de um texto de palavras ao acaso, os físicos o compararam com textos reais em várias línguas, e identificaram parâmetros das redes que permitem distinguir um texto aleatório de um texto real.
"Fizemos redes com textos reais de 15 idiomas e utilizamos mais de 20 métricas para verificar quais distinguiam um texto aleatório de um texto real. Dessa forma, conseguimos verificar que o Voynich não é um texto aleatório. Pretendíamos também identificar a qual idioma o Voynich é mais similar, mas a quantidade de dados de que dispúnhamos não foi suficiente para obter conclusões estatisticamente significativas. Infelizmente não há muitos textos traduzidos em diversas línguas que estejam disponíveis na internet," conta o professor.
Para identificar as palavras-chave do Voynich, os físicos verificaram nas métricas de rede e séries temporais quais palavras se sobressaiam. E para comprovar a razoabilidade da estratégia, foram utilizadas as mesmas táticas para textos de idiomas conhecidos.
"Utilizamos estratégias de controle, para saber se aquela metodologia era eficiente. No nosso caso, comparamos textos do Novo Testamento em 15 idiomas para identificar palavras-chave. Como a estratégia deu certo, ela também foi utilizada para detectar as palavras-chave do Voynich", afirma Oliveira Junior.
Linguagem do Voynich
A conclusão é que o manuscrito Voynich não é um texto aleatório, tendo sido provavelmente escrito em um idioma desconhecido, artificial.
Mais importante ainda é que as estratégias utilizadas pelos pesquisadores funcionaram bem, o que poderá dar pistas importantes aos futuros (e corajosos) decifradores do manuscrito.
O professor comenta que, embora a análise do misterioso Voynich tenha sido um dos alvos principais da pesquisa, as abordagens de física estatística e física computacional desenvolvidas podem ser úteis para muitas outras aplicações. O conhecimento gerado pode auxiliar na análise de grandes volumes de dados, inclusive de textos.
"Hoje, a maneira como uma máquina aprende é muito rudimentar, requerendo intensa participação de humanos. No futuro, será possível que o computador tome decisões de como aprender e fazer aquisições dessas informações, transformando-as em conhecimento, inclusive para ele próprio", avalia ele.
FONTE: USP

Nenhum comentário:

Postar um comentário

# Compartilhe .