RAID

Iniciado por José Costa, 26 / Ago / 2012, 06:50

Tópico anterior - Tópico seguinte

0 Membros e 1 Visitante estão a ver este tópico.

José Costa

RAID

RAID é o acrónimo de "redundant array of independent disks), mas que originalmente era "redundant array of inexpensive disks" e cujos conceitos foram descritos por volta do ano de 1987/88. O RAID tornou-se um padrão na indústria de edição vídeo, e não só,  em aplicações que exigem armazenamento rápido e confiável.

A ideia básica do RAID foi combinar vários discos rígidos, de pequena capacidade e de baixo custo (comparativamente ãos SCSI existentes na época, de maior capacidade e muito mais caros), numa matriz ou agrupamento, de forma a fornecer uma maior capacidade de armazenamento, uma maior velocidade ou taxa de gravação/leitura dos dados e uma maior confiabilidade, com vista a evitar a perda dos dados no caso de uma avaria num dos discos rígidos. Este conjunto de discos surge no computador como uma única unidade de armazenamento ou disco rígido.

Actualmente a ideia mantém-se, mas a prioridade não é mais o preço (pois os preços por GB têm vindo gradualmente a baixar) mas sim o aumento da capacidade e da velocidade de gravação/leitura dos dados, além da segurança dos mesmos.

São já muitas as boards que hoje em dia trazem suporte a RAID, permitindo assim acelerar a leitura/gravação em disco, recurso que beneficia largamente a edição vídeo. Por norma o RAID vem desactivado na board, mas basta aceder à bios e activar o mesmo, para a custo zero se obter um maior desempenho no armazenamento.

O sistema RAID pode ser implementado por software (Windows 2000, XP, Seven, Linux,...) ou por hardware, e consiste num conjunto de dois ou mais discos rígidos, recorrendo basicamente a duas técnicas:

1 –  Através da divisão dos dados: os dados são distribuídos por vários discos e em que cada um deles tem apenas de gravar uma parte dos dados totais, resultando num sistema de disco mais rápido.

2 - Através do chamado espelhamento dos dados: os dados são gravados em mais que um disco, duplicados, resultando numa leitura mais rápida e na segurança dos dados.

Estas duas técnicas podem ser usadas isoladamente ou em conjunto.

Em geral, o uso do RAID oferece as seguintes vantagens:

- Redundância dos dados: Ajuda a proteger os dados no caso de falha no disco rígido, ou discos rígidos. Esta característica não se aplica ão RAID-0.

- Aumento da capacidade de armazenamento: fornece uma maior capacidade, pela combinação dos vários discos rígidos que compõem a matriz. Torna possível o uso de vários discos, que são vistos como um só pelo sistema operativo.

- Aumento do desempenho: a leitura e gravação dos dados torna-se muito mais rápida, modo geral. O desempenho do RAID depende do nível de RAID utilizado, pois como explicado abaixo, existem vários níveis de RAID. As aplicações que dependem fortemente do acesso ãos dados (gravação/leitura), como é o caso do vídeo, têm no RAID a melhor opção.

Nota: Redundância é a capacidade de um sistema se manter em pleno funcionamento e, preferencialmente, sem degradação das suas características. No caso do armazenamento, é a possibilidade de um ou mais discos rígidos avariarem e mesmo assim não ocorrer perca dos dados, além de permitir que o PC ou PCs continuem a ler/gravar dados, até ser possível efectuar a troca do disco avariado por um outro em bom estado.


Níveis de RAID
Existem vários níveis de RAID. A eficiência da capacidade de armazenamento utilizada e as vantagens RAID dependem do nível de RAID utilizado. Em vídeo, são utilizados normalmente os seguintes níveis RAID:


RAID 0 ou "Striping"
(Não-redundante)

Oferece um alto I/O nas operações de leitura/gravação dos dados, pois o acesso ãos discos pode ser feito simultaneamente. Na gravação os dados são divididos em segmentos consecutivos e gravados sequencialmente em cada um dos discos rígidos que compõem o array. Chama-se array ão conjunto dos discos que estão agrupados no RAID. Derivado a esta divisão, cada disco grava uma parte do ficheiro (segmentos), tendo como resultado uma gravação mais rápida, uma maior  taxa de transferência de dados.

No processo de leitura, estes segmentos são lidos simultaneamente por todos os discos, "recriando-se" o ficheiro original, resultando também numa maior taxa de transferência de dados.

RAID 0 é o nível mais rápido e mais eficiente, já que nenhuma informação redundante é armazenada e nenhum espaço em disco é ocupado pelos dados de paridade. Por tal facto, este nível não oferece tolerância a falhas: no caso de falha de um disco rígido, o resultado é a perda total de todos os dados. Em compensação, a capacidade total é a soma individual de cada disco rígido. Exemplo: se agruparmos 2 discos rígidos de 1 TB cada um, o armazenamento total disponível é de 2 TB.

Nota: dados de paridade são dados criados pelo sistema e que têm como função confirmar e garantir a integridade dos dados, assegurando que no caso de falha de um disco, o sistema consegue recriar os dados que se perderam no disco avariado. Estes dados "recriados" são uma cópia exacta dos dados perdidos, pelo que não ocorre nenhuma perda de informação, apesar de um ou mais discos falhar. De salientar que no RAID 0 não são criados dados de paridade, pois RAID 0 não tem redundância .

Vantagens:
- Um acesso mais rápido ãos dados, quer na leitura, quer na gravação. Com sistemas devidamente configurados, este acesso pode ser até 80% mais rápido.

- Facilidade de implementação e baixo custo no aumento da capacidade.

Desvantagens:
- No caso de algum disco ter uma corrupção dos dados num ficheiro, todo o ficheiro se perde, pois as restantes partes do ficheiro, existentes nos outros discos rígidos, deixam de poder ser utilizados.

- No caso de uma avaria num disco rígido, todos os dados existentes em todos os discos do array se perdem.

São necessários pelo menos 2 discos para se implementar o RAID 0.

RAID 0 é um nível bastante utilizado em sistemas de vídeo NLE, pelo elevado desempenho em disco que proporciona.


RAID 1 ou " Mirroring"
(Redundante)

Este nível oferece redundância através da gravação de todos os dados para dois ou mais discos, simultaneamente.  Se um disco falhar, os dados são recuperados a partir do outro disco do array RAID, também chamado de "espelho".  Esta é talvez a melhor escolha, a nível de desempenho e segurança crítica dos dados, quando não são utilizados mais que dois discos rígidos. Em sistemas de grande capacidade, em que são utilizados dezenas ou até mesmo centenas de discos rígidos, o RAID 1 é um nível pouco eficiente e bastante caro de implementar, pois a capacidade total disponível é de apenas 50% e o preço por GB de dados armazenados é o dobro. O custo por GB é alto mas a confiabilidade é máxima.

Exemplo: com dois discos rígidos de 1 TB cada um e agrupados no nível 1,  o armazenamento disponível é de 1 TB.

Em comparação com um único disco rígido, um array de dois discos no nível RAID 1 tem um acesso um pouco mais rápido ãos dados na leitura, mas é mais lento na gravação. Se um disco falhar, nenhum dado é perdido e a taxa de leitura/gravação é idêntica à de  um só disco.

Vantagens:
- No caso de algum disco falhar, os dados são lidos do segundo disco.

- Não existe perda de dados, mesmo que ocorra uma corrupção de dados nalgum disco.

- Rebuild rápido.

Desvantagens:
- Custo alto, se comparado ao RAID 0.

- Tempos de escrita mais elevados.

Nota: Chama-se Rebuild ão processo de recriação dos dados, quando um disco falha.

São necessários pelo menos 2 discos para se implementar o RAID 1.

RAID 1 é utilizado normalmente em sistemas críticos, em que não pode haver perda ou corrupção de dados, e em que o próprio sistema não pode cair, ou seja, não pode ser desligado. É o caso de servidores vídeo e sistemas de gravação em campo, em que desligar o sistema durante um concerto, por exemplo, não é opção. Nestes casos, o disco avariado é substituído por um novo, mesmo com o equipamento a funcionar e a gravar, naquilo que se chama "troca a quente". Alguns sistemas possuem mesmo discos extra, parados, que em caso de avaria de um disco, estes discos parados entram imediatamente em funcionamento, mesmo sem a interacção do utilizador.


RAID 3
(Redundante)

O RAID 3 é usado frequentemente em dados intensivos ou ambientes de um único utilizador, que acessão longos registros sequenciais, como no caso do vídeo. A arquitectura não permite várias operações de I/O sobrepostas e requer sincronização das drives, a fim de evitar a degradação do desempenho com registros de curta duração.

Os dados são divididos e gravados em dois discos rígidos, e um terceiro grava a paridade dos mesmos. Existe, portanto, uma perca de capacidade de 1/3. Por exemplo: com três discos rígidos de 1 TB cada um e agrupados no nível 3,  o armazenamento disponível é de 2 TB.

Vantagens:
- leitura rápida
- escrita rápida
- possui controle de erros

Desvantagem:
- criação difícil via software
- perca de capacidade em 1/3

São necessários pelo menos 3 discos para se implementar um RAID 3.

O RAID 3 é bastante utilizado em sistemas de edição vídeo, mas tem vindo a ser substituído pelo RAID 5, pelo melhor aproveitamento do espaço em disco que o RAID 5 oferece.


RAID 5
(Redundante)

O RAID5 distribui os dados e a paridade por todos os discos rígidos que fazem parte do array. É bastante utilizado em ambientes de multi-utilizador e largamente utilizado em vídeo.

Porque os dados são distribuídos por todos os discos, a leitura/gravação é mais rápida, comparativamente a um só disco. São necessários pelo menos três discos rígidos, e neste caso existe a perca de 1/3 da capacidade em disco, tal como no RAID 3. No entanto, à medida que mais discos vão fazendo parte do array, esta perca de capacidade vai diminuindo. Num array com 5 discos, a perca é de 1/5 e num array de 10 discos, a perca é de 1/10. Ou seja, a perca de capacidade é sempre a de um disco, qualquer que seja o nº de discos que fazem parte do array.

É seguramente o nível RAID com menor perca de capacidade, depois do RAID 0, razão pela qual é bastante utilizado. Como desvantagem, tem o tempo de rebuild que é mais elevado,  e apesar do sistema de armazenamento se manter em funcionamento, permitindo ler e gravar com um disco avariado, o seu desempenho é ligeiramente inferior durante o rebuild. Apesar disso, não existe perca de dados.


Outros níveis
Outros níveis RAID existem, no entanto estes são os mais utilizados, quer por grandes produtoras, por estações de televisão ou por editores freelancer.  Apesar de ser uma tecnologia com já cerca 24 anos, não deixa de ser uma tecnologia bastante actual e com grande impacto na industria audiovisual. Os grandes avanços que se tem verificado a nível da velocidade dos discos rígidos, quer convencionais ou mecânicos, quer discos SSD, todos esses avanços não têm sido suficientes para aposentar o bom e velho RAID.

O RAID está vivo e recomenda-se. O PC agradece.

by José Costa


Se encontrou algum erro ou alguma informação incorrecta, agradeço que me avise por mensagem privada, com o titulo do tópico no assunto.

Se quizer comentar ou perguntar algo sobre este assunto, queira criar um tópico na seguinte secção, colocando o titulo RAID.  Se o tópico já existir, é só colocar o seu comentário/pergunta.

O profissional inovador não segue a multidão. Ele tem lucidez para remar contra a maré e não se importa em ser taxado como "um estranho no ninho". - Luiz Roberto Carnier