Estudos iniciais e início do primeiro protótipo

22 de maio de 2007

  • A primeira etapa descrita no cronograma do projeto é o estudo da norma OpenXML. Durante a primeira quinzena do mês, dediquei-me a um estudo introdutório da norma, dando ênfase à linguagem WordprocessingML, que descreve os documentos de texto do Word, além da convenção Open Packaging, que descreve a organização de um pacote OpenXML.
  • Decidi adiar o aprofundamento no estudo da norma para a fase de desenvolvimento do gerador de código OpenXML, onde ele será realmente necessário. Além disso, cerca de 70% da descrição da norma é composta de referência para todos os comandos e estruturas dos arquivos OpenXML e apenas uma parte dela refere-se a arquivos de texto (há ainda as planilhas, apresentações e desenhos).
  • Para o primeiro formato de entrada do conversor, escolhi o Rich Text Format, pois ele é universalmente aceito nos sistemas atuais e possui uma especificação simples e arquivos perfeitamente legíveis pelo ser humano. Além de permitir o desenvolvimento de um leitor (parser + interpretador) para RTF, o estudo da norma enriquece com o aprendizado de como funciona um arquivo de texto formatado, de uma maneira geral e independente de formato.
  • O leitor RTF já está sendo desenvolvido, a partir da especificação oficial (ISO) do formato, onde há um código de sugestão para desenvolvimento de um leitor em linguagem C. O parser está pronto, e agora estou trabalhando na interpretação das palavras de controle (mudança de atributos, direcionamento e controles especiais) associadas aos blocos de texto. Assim que o leitor for capaz de interpretar atributos básicos como negrito, itálico, cor e etc, uma versão beta será lançada, e poderá ser adaptada como biblioteca em uma aplicação que utiliza RTF.

Last edited May 22, 2007 at 11:33 PM by csauer, version 4

Comments

No comments yet.