quinta-feira, 8 de julho de 2010

Emulador universal salva informação digital para futuras gerações

Quem gosta de jogos de computadores mais antigos costuma ter uma coleção de emuladores quase tão grande quanto a própria coleção de games. Isso acontece porque cada emulador é específico para uma plataforma, tanto de origem quanto de destino - um emulador que lhe permite hoje jogar Space Invaders no PC não o permitirá fazê-lo nas plataformas do futuro.




Emulador universal

Pensando nisto, um grupo de pesquisadores europeus começou um projeto mais ambicioso: eles estão construindo um emulador universal, um programa capaz de reconhecer e rodar todos os tipos de arquivos de computador já gerados até hoje,
O emulador universal reconhecerá os dados antigos nos computadores atuais e poderá ser facilmente atualizável para rodar nas novas arquiteturas de informática que ainda serão desenvolvidas no futuro.
O projeto foi batizado de Keep, a palavra em inglês para manter. O termo é também um acrônimo para Keeping Emulation Environments Portable - mantendo os ambientes de emulação portáveis.

Herança digital

O objetivo do Keep é garantir o acesso das futuras gerações a todos os arquivos digitais já produzidos e que serão produzidos doravante, incluindo arquivos de texto, som, imagens, multimídia, sites, bases de dados e videogames.
"As pessoas não pensam duas vezes ao salvar seus arquivos digitalmente - das fotos capturadas com o celular até arquivos com informações governamentais. Mas cada arquivo digital corre o risco de ser perdido, seja pela degradação da mídia, seja porque a tecnologia usada para lê-lo irá simplesmente deixar de existir," diz a professora Janet Delve.
"As antigas gerações deixaram um rico acervo de livros, cartas e documentos que nos dizem quem eles foram, como eles viveram e o que eles descobriram. Há um risco real de que nós possamos deixar como herança um espaço em branco na história," diz ela.

Escribas digitais

Um emulador universal pode ser a única opção para evitar essa perda de informações. Copiar todas os dados gerados para nas novas plataformas, à semelhança de escribas digitais modernos, é impraticável - calcula-se que em 2010 a informação digitalizada será equivalente a 18 milhões de vezes o conteúdo de todos os livros já escritos desde o início da civilização.
Além da dificuldade técnica, a simples cópia coloca riscos adicionais, tanto de erros nas cópias quanto de danos às mídias originais.
"A diferença com a emulação é que você está livre desses problemas. Cada vez que o hardware, o software, os sistemas operacionais ou qualquer outra coisa seja atualizada, a máquina Keep simplesmente emulará esta nova plataforma. Será um mecanismo à prova de futuro," diz Dan Pinchbeck, outro membro do grupo.
Os trabalhos do projeto Keep começaram em janeiro e deverão se estender até 2012.

Censo da Internet gera primeiro mapa completo da rede mundial

Está pronto o primeiro censo da Internet depois que a rede mundial transformou o mundo. Foram 62 dias de pesquisas e 3 bilhões de pings, em uma varredura que abrangeu os mais de 2,8 milhões de endereços atualmente alocados na rede mundial. O último censo havia sido feito em 1982, quando a Internet contava com apenas 385 servidores.


Ping global

"Um censo da Internet é exatamente isto: foi enviado um comando para cada endereço único alocado em toda a Internet," explica o pesquisador John Heidemannn, da Universidade Southern California, nos Estados Unidos.
O comando a que se refere o pesquisador é o ping, um pequeno programa existente em virtualmente todos os computadores, e cuja única tarefa é enviar uma espécie de "Olá" para outro computador e esperar a resposta. Tecnicamente esse "Olá" é um pacote de solicitação de resposta chamado ICMP - Internet Control Message Protocol.
A maioria dos comandos ping - 61% deles - não obteve resposta. Uma quantidade significativa do restante deu respostas como "Não perturbe" ou "Nenhuma informação disponível." Esse comportamento pode ser programado pelos administradores de rede em seus firewalls e roteadores.


Mapa numérico

Ainda assim, os cientistas conseguiram compilar o mais completo atlas da Internet já feito até hoje, compilando inclusive as "respostas negativas". Em resolução total, cada pixel do mapa representa 162 endereços IP individuais.
Embora o mapa mostre áreas geográficas, ele não é um mapa geográfico. Trata-se de um mapa numérico, construído sobre a estrutura matemática do sistema de endereços da Internet.


Endereços IP
Cada endereço, atribuído a cada servidor da Internet, é um número entre 0 e 2 elevado à 32ª potência - o que resulta em 4.294.967.295 possibilidades - escritos em uma notação característica de quatro números de base 10 separados por pontos - o já conhecido endereço IP. Cada um dos quatro números representa um segmento de 8 bits do endereço completo.

Esses endereços aparecem no mapa como uma rede de quadrados, cada quadrado representando todos os endereços começando com o mesmo número. O mapa foi organizado em ordem numérica crescente mas em um padrão circular, chamado curva de Hilbert. Com isto os endereços adjacentes são mantidos fisicamente próximos uns aos outros no quadro, permitindo que se faça um zoom perfeito, mostrando cada vez mais detalhes.


Mapa da Internet

Cada pixel da imagem do mapa representa as respostas médias de 65.536 endereços, codificados em um sistema de cores - se todas as respostas tiverem sido positivas o pixel é verde verde, se todas foram negativas o pixel é vermelho, com o amarelo representando iguais níveis de resposta e não-resposta e uma variada gradação para os dados intermediários.
Os pesquisadores também imprimiram uma versão do mapa da Internet no qual cada pixel representa um endereço individual. A uma resolução de 1.200 DPI, o mapa resultante é um quadrado cujos lados medem 2,75 metros.
Os cientistas agora querem construir um mapa dinâmico, que seja atualizado continuamente. Eles esperam com isso ter uma ferramenta incomparável para o monitoramento e a detecção de tendências no crescimento da rede mundial.

Windows Live SkyDrive : armazenamento de dados on-line

Trata-se de um serviço gratuito para armazenamento de dados on-line. Segundo a Microsoft, o Skydrive “funciona bem em qualquer computador Windows ou Macintosh”. O acesso é feito por meio de senha individual.
Inicialmente, é oferecido um espaço de 5 GB. Os arquivos podem ser organizados em pastas. As pastas podem ser configurados para acesso privativo, público ou compartilhado.
As vantagens do sistema são várias. Se o usuário planejar bem o uso, o Skydrive pode ser uma solução permanente de armazenamento de dados (as máquinas mudariam, mas os dados permaneceriam); o sistema proporcionaria uma cópia de segurança on-line, que será preservada caso o HD local apresente problemas; os dados ficam disponíveis remotamente, e podem ser compartilhados com quem se deseje.
O problema potencial, que inevitavelmente será discutido na internet, é a privacidade: certamente surgirão casos de acesso indevido e exposição indevida. Resta ver como a Microsoft lidará com essas questões que são sempre complicadas, ainda mais no caso de um serviço gratuito.

Apresentação Final

quarta-feira, 7 de julho de 2010

Copiando tudo para a web

Existem por aí diversas soluções de armazenamento on-line de arquivos, com recursos e capacidades variados. Ouve-se falar muito bem do Box.net e do Rsync.net, por exemplo, mas cada pessoa deve avaliar qual a solução cujos termos de serviço e de privacidade/confidencialidade melhor lhe sirva. Em especial, não é muito recomendado usar recursos cujos Termos de Serviço não incluam a disponibilidade como solução de armazenamento permanente de arquivos. Há quem use “gambiarras” baseadas no Gmail e outros sistemas de correio gratuitos para preservar seus arquivos, mas segurança envolve preocupar-se inclusive com os termos de uso. Dreamhost é mais recomendado a quem queira hospedar projetos web individuais e pessoais, e até pouco tempo atrás os termos de serviço da empresa eram bem específicos sobre o uso do vasto (a ponto de ser irreal) espaço em disco oferecido aos clientes , eles só podiam ser usados para arquivos de sites, e não para backup, para repositórios, e outras finalidades comuns.
Mas há poucos meses tudo mudou: cada cliente passou a contar com uma área de 50gb para backups via rede, que não é disponibilizada para acesso via web, e não tem as mesmas restrições de conteúdo – embora você não possa usar para arquivos cuja posse ou transferência seja ilegal, e nem deva usar para arquivos que comprometam a sua privacidade ou segurança além do nível em que você esteja disposto. Nitidamente, as condições servem para backup secundário, complementar a uma estratégia baseada em mídias locais (DVDs, por exemplo), inclusive porque a Dreamhost não faz backup adicional destes arquivos – se você apagar, ou se der erro nos sistemas de redundância de discos deles, já era. Para cópias únicas, não serve. Para backup secundário, é bom. Como backup primário, é melhor do que nada e, dependendo das ameaças que mais influenciam o risco dos seus dados, pode até ser melhor do que uma simples cópia em HD local.

Tipos de Backup

Tipos de backup
O utilitário de backup oferece suporte a cinco métodos para backup de dados no computador ou na rede.
Backup de cópia
Um backup de cópia copia todos os arquivos selecionados, mas não os marca como arquivos que passaram por backup (ou seja, o atributo de arquivo não é desmarcado). A cópia é útil caso você queira fazer backup de arquivos entre os backups normal e incremental, pois ela não afeta essas outras operações de backup.
Backup diário
Um backup diário copia todos os arquivos selecionados que foram modificados no dia de execução do backup diário. Os arquivos não são marcados como arquivos que passaram por backup (o atributo de arquivo não é desmarcado).
Backup diferencial
Um backup diferencial copia arquivos criados ou alterados desde o último backup normal ou incremental. Não marca os arquivos como arquivos que passaram por backup (o atributo de arquivo não é desmarcado). Se você estiver executando uma combinação dos backups normal e diferencial, a restauração de arquivos e pastas exigirá o último backup normal e o último backup diferencial.
Backup incremental
Um backup incremental copia somente os arquivos criados ou alterados desde o último backup normal ou incremental. e os marca como arquivos que passaram por backup (o atributo de arquivo é desmarcado). Se você utilizar uma combinação dos backups normal e incremental, precisará do último conjunto de backup normal e de todos os conjuntos de backups incrementais para restaurar os dados.
Backup normal
Um backup normal copia todos os arquivos selecionados e os marca como arquivos que passaram por backup (ou seja, o atributo de arquivo é desmarcado). Com backups normais, você só precisa da cópia mais recente do arquivo ou da fita de backup para restaurar todos os arquivos. Geralmente, o backup normal é executado quando você cria um conjunto de backup pela primeira vez.
O backup dos dados que utiliza uma combinação de backups normal e incremental exige menos espaço de armazenamento e é o método mais rápido. No entanto, a recuperação de arquivos pode ser difícil e lenta porque o conjunto de backup pode estar armazenado em vários discos ou fitas.
O backup dos dados que utiliza uma combinação dos backups normal e diferencial é mais longo, principalmente se os dados forem alterados com freqüência, mas facilita a restauração de dados, porque o conjunto de backup geralmente é armazenado apenas em alguns discos ou fitas.
http://technet.microsoft.com/pt-br/library/cc779607(WS.10).aspx

Dados armazenados em sistemas redundantes

Para EMC, o atentado ao World Trade Center transformou os conceitos de emergência na segurança de dados.
A EMC é a líder no armazenamento de dados em rede( NIS, de Network Information Storage), onde detém 39% do mercado com seus sistemas Symmetrix ( conjuntos de discos rígidos, memória, e software de controle com capacidade de até 80 terabytes). É a campeã no quesito segurança com o SRDF ( Symmetrix Remote Data Facility), dois sistemas Symmetrix redundantes, interconectados, sincronizados e controlado por um software que faz com que o sistema "espelho" assuma imediatamente as funções do sistema-base caso seu funcionamento seja interrompido.
Existem mais de 11 mil SRDF' s em todo o mundo, dos quais 27 estavam nas torres gêmeas, consta que 26 deles preservaram integralmente seus dados. O único que falhou estava espelhado na segunda torre.
Para minimizar as consequências de um desastre que possa destruir recursos de informação é necessária a implementação de um plano de continuidade. Esse plano deve ter definido seu escopo e pode ser restrito aos recursos de tecnologia, ou ser mais abrangente e contemplar a recuperação do negócio da organização.
Para ambos os casos, a recuperação das informações é fundamental. Cópias de segurança ou soluções que têm o mesmo objetivo, porém, com custos diferentes.
A solução de redundância em tempo real (espelhamento) é a mais eficiente e a que oferece maior grau de certeza de aproveitamento imediato da cópia dos dados perdidos. A escolha do local onde ficarão os dados espelhados é crítica para se enfrentar situações de desastre. Quanto mais longe é melhor. É melhor em termos de proteção, mas traz complicado custo e alguns procedimentos operacionais.