Анатомия на инфраструктура облак съхранение

Модел, функциите и вътрешните части

система за съхранение в облак (или за съхранение на данни като услуга) - това е абстрактно понятие, което съответства на система за съхранение на данни, което може да се управлява по заявка чрез специален интерфейс. Този интерфейс резюмета и местоположение на системата, така че да е локален или отдалечен (или хибрид) - няма значение. Cloud инфраструктура за съхранение форма нови архитектури, които поддържат различни нива на услуги над потенциално големия група от клиенти и географски разпръснати дискове. В статията се разглеждат основните архитектурни качества на облак съхранение - от сигурността и целостта на данните за сигурност и оптимизация.

М. Tim Dzhons. Консултант инженер, Emulex Corp.

Ако тези проценти, които днес обеми от данни растат, това не е изненадващо, че нарастващата популярност на облачни и складови системи. Най-бързо развиващите обеми на исторически данни, които са идеални за съхранение в облака при определени условия, включително условията на рентабилността, честотата на лечение, защита и достъпност. Но не всички системи за съхранение на облак са едни и същи. Един доставчик, може да се съсредоточи предимно върху разходите, а от друга страна се фокусира върху достъпността или изпълнение. Никой от архитектурата не се фокусира върху едно нещо, и степента, в която дадена характеристика архитектура определя целта си на пазара и модел употреба.

Често използвани съкращения

  • API: програмиране на приложения програмен интерфейс / интерфейс за приложно
  • FTP: прехвърляне на файлове протокол Transfer Protocol / файла
  • HTTP: Hypertext Transfer Protocol / Hypertext Transfer Protocol
  • HTTPS: HTTP над Secure Sockets Layer / HTTP над Secure Sockets Ниво
  • JFS: журнал на файловата система / Journaling File System
  • NFS: Мрежова файлова система / Network File System
  • NIC: мрежова карта / Мрежа карта
  • RAID: Излишните масив от независими дискове / Redundant Array на независимите Дискове
  • ПОЧИВКА: представителна държавна Transfer / представителна държавна Transfer
  • SAN: Storage Area Network / мрежи за съхранение
  • SCSI: Малък Computer System Interface / Small Computer System Interface
  • SLA: споразумение за нивото на обслужване / SLA
  • TCP: Протокол за управление на предаването / предаване контрол протокол
  • UDP: User Datagram Protocol / User Datagram Protocol
  • WAN: широкообхватна мрежа / Global Network

Трудно е да се говори за архитектура, без да отчита неговите работни параметри. С това имам предвид различните характеристики на архитектурата, включително разходите, производителността, отдалечен достъп и т.н. Ето защо, ние първо се определи набор от критерии, който измерва характеристиките на модела за съхранение облак, и след това да разгледаме някои интересни изпълнение.

Първо, нека да поговорим за облак архитектура за съхранение като цяло, за да се определи контекста на проучването за проследяване на уникалните характеристики на тази архитектура.

Обща архитектура

Cloud архитектура за съхранение - е преди всичко за доставка на ресурсите за съхранение при поискване в силно мащабируем и multitenantnoy среда. Общата архитектура облак съхранение е външен интерфейс, който осигурява API за достъп дискове (вж. Фигура 1). В традиционната за съхранение е системите за данни SCSI протокол, но в облака, нови протоколи. Сред тях можем да намерим външни протоколи за услуги в мрежата, доклади на файлове и дори по-традиционни външни интерфейси (Internet SCSI, ISCSI и т.н ..). За външен интерфейс е нивото на мидълуер, който аз наричам логиката за съхранение на данни. Това ниво се изпълняват редица функции, като например репликация на данни и намаляване на обема на данните в традиционни алгоритми за разположения на данни (въз основа на географското местоположение). И накрая, на вътрешния интерфейс организира съхраняването на физическата данни. Това може да е вътрешен протокол, който изпълнява конкретна функция, или на традиционно сървъра физически дискове.

Фигура архитектура 1. облак съхранение

Фигура 1 показва някои от характеристиките на съвременната архитектура облак съхранение. Имайте предвид, че характеристиките не са изключителна собственост на определено ниво, но просто се отнасят до темите, които се обсъждат в тази статия. Тези характеристики са определени в Таблица 1.

Таблица 1. Характеристики архитектура облак съхранение

управляемост

Развиване на умения сред по тази тема

метод на достъп

Един от най-ярките различия между традиционните системи за съхранение в облака и са средство за достъп до нея (вж. Фигура 2). Повечето доставчици предлагат различни методи за достъп, обаче, са общи API Web-услуги. Много от тези принципи се прилагат в REST, че предполага, обектно-ориентиран схема, разработена през HTTP (с използване на HTTP като транспортен). REST API-прост и ефективен без гражданство. REST API-реализиране на много доставчици на услуги облак съхранение, включително Amazon Simple Storage Service (Amazon S3), Windows Azure ™ и Mezeo Cloud Platform съхранение.

Един от проблемите на API уеб-услуги се дължи на това, че за да се възползвате от базирана в облака система за съхранение, те трябва да се интегрират с приложението. Ето защо, система за съхранение облак, за да се осигури пряка интеграция също така да използвате общи методи за достъп. Например, файлови базирани протоколи като NFS / Обща Internet File System (CIFS) или FTP, или базирани на блокове протоколи, като например ISCSI. Тези методи осигуряват достъп Nirvanix, Zetta, Cleversafe и други доставчици на услуги облак съхранение.

Посочените по-горе протоколи са най-често срещаните, но подходящи за съхранение в облака, и др. Един от най-интересните - уеб базиран Разпределени Authoring и Версиите (WebDAV). WebDAV също се базира на HTTP и ви позволява да използвате Интернет като ресурс за четене и писане. Броят на доставчици, използващи WebDAV, въведете Zetta, Cleversafe и др.

Фигура 2. Методи за достъп до система за съхранение на данни мътен

Можете да намерите решения, които поддържат множество протоколи за достъп. Например, IBM® Смарт Бизнес Storage Cloud ви позволява да използвате файл базирани протоколи (NFS и CIFS) и SAN-базирани протоколи в една и съща инфраструктура, за виртуализация.

продуктивност

Има много аспекти на изпълнението, но основният проблем е система за съхранение на облак - движение на данни между потребителя и отдалечен доставчик на клауд-базирани услуги. Проблемът се крие в TCP, основният работен кон на Интернет. TCP контролира потока на данни въз основа на потвърждение пакети от отдалечения възел. Загуба или забавяне на пакети резултати в прилагането на мерки за ограничаване на пакети клъстери с допълнително ограничение на изпълнение, с цел избягване на глобалните проблеми в мрежата. TCP е идеален за преместване на малки количества данни през интернет, но не и за доставка на големи обеми от данни - в този случай, времето за комуникация (RTT) се увеличава.

Amazon чрез Aspera Software е решила този проблем чрез изтриване на уравнението TCP. За да се ускори масово движение на данни, за да се избегне голяма RTT и голяма загуба на пакети, разработен нов протокол бързо и сигурно Protocol (FASP ™). Ключът е UDP, допълнителен превоз, протокол с отношение е TCP. UDP позволява контрол на претоварването възел, предаване този аспект на FASP на приложния слой протокол (вж. Фигура 3).

Фигура 3. Протокол бързо и сигурно Протокол за Aspera Software

Работа със стандартните мрежови карти (без ускорение), приложение FASP ефективно използва наличния капацитет и избягва големите затруднения, традиционните схеми за предаване на данни от мас. Вижте ресурси за линкове към интересни статистически данни за изпълнението на FASP в сравнение с традиционните глобални мрежи, междуконтинентални трансмисии и спътникови комуникационни канали.

Multitenantnost

мащабируемост

Скалируемост може да се разглежда от няколко гледни точки, но ние сме най-вече се интересуват от разпределението на съхранение при поискване облак. Възможност за увеличаване на капацитета за съхранение (и двете нагоре и надолу) означава подобрена икономическа ефективност за потребителите и по-голяма сложност за доставчика на облачни услуги.

Фигура 4. мащабируеми облак съхранение

инфраструктурата за съхранение в облак и трябва да осигури вътрешен мащабиране. Сървъри и система за съхранение трябва да позволяват промяна на размера, без никакви последствия за потребителя. Както е обсъдено в раздела за манипулации. Cloud архитектура за съхранение трябва да подкрепя самостоятелен компютри.

висока надеждност

Когато доставчик на услуги в облака за съхранение на потребителски данни, тя трябва да бъде в състояние да се върне на данните на потребителя при поискване. Като се има предвид просто мрежа, ръководство за грешка и други обстоятелства това състояние надежден и детерминирана начин може да бъде трудно.

Фигура 5. Cleversafe подход към висока достъпност на данните

Възможност за намаляване на данни с помощта на Рийд-Соломон корекция код позволява географски разпределени устройства за съхранение. Когато броят на акции и допустимото количество р повреди м резултат над е р / (р -m). По този начин, в случая, показан на фигура 5. над системата за съхранение, когато р = 4 и m = 1 е 33%.

Недостатъкът IDA - интензивна обработка без хардуерно ускорение. Репликация - още един полезен метод, който се използва от много доставчици на услуги в облака. Това е прост и ефективен, въпреки че над високо (100%).

управление

Важно за способността на клиента да наблюдава и контролира как се съхраняват своите данни, както и свързаните с това разходи. Много доставчици на облачни предлагат инструменти за управление, които предоставят на потребителите по-голям контрол върху разходите.

Amazon, за осигуряване на потребителите с помощта на минимизиране на общите разходи за съхранение на данни, използва намалена Redundancy съхранение (RRS). Данните се реплицира в инфраструктурата на Amazon S3, но RRS им позволява да копират минимален период от време с възможност за възстановяване в случай на загуба на данни. То е идеално за данни, които можете да пресъздаде или когато копия на данните се намират на различни места. Nirvanix също така осигурява репликация, основана на политиката, което позволява по-детайлен контрол върху това как и къде данни се съхраняват.

ефикасност

ефективност на съхранение - важна характеристика на инфраструктурата за съхранение облак, особено като се има акцент в цялостната икономика. Следващата част е посветена специално на разходите, както и тази характеристика е по-свързани с ефективното използване на наличните ресурси, отколкото да им цена.

За да бъде системата за съхранение по-ефективно, трябва да се съхранява повече данни. Най-честото решение е да се намали количеството на необработени данни, така че те заемат по-малко физическо пространство. Два начина да се постигне това: Компресиране - компресиране на данните от тях кодиране с помощта на различни представяния - и дедупликация - премахването на всички дублиращи се данни. Въпреки че и двата метода са полезни включва обработка на компресия (кодиране на данни от и към инфраструктурата) и премахване на дублирането - изчисление на подписи, за да намерите дубликати.

Един от най-забележителните черти на облак съхранение - способността да се реализират икономии. Това спестява на съхранението на покупката, на своите енергийни доставки, ремонт и управление на съхранение. Ако ние считаме, съхранението облачност в този момент (включително SLA и повишаване на ефективността на съхранение), може да бъде полезно при определени модели за ползване.

Интересен пример е облачни решения за съхранение на компанията Backblaze (см. Ресурси). Тя построен решение за съхранение на ниски цени специално за облачни предложения. Backblaze POD (гаражен) капацитет от 67 TB на съхранение в пакет 4U за по-малко от $ 8000. Комплексът се състои от 4U жилища системна платка 4 GB оперативна памет, четири SATA контролери, 45 SATA твърди дискове 1.5 TB и две захранвания. системната платка на Backblaze работи Linux® (JFS като файлова система) и мрежови адаптери GbE като външен интерфейс с помощта на HTTPS и Apache Tomcat. софтуер BackBlaze включва премахване на дублирането, криптиране и защита на данните RAID6. От описанието на предложения от нея BackBlaze POD (което подробно показва как да се изгради своя собствена), виждаме, степента, в която компанията може да намали разходите за съхранение, като облак съхранение жизнеспособен и икономически ефективно решение.

модел за съхранение в облак

Досега говорих главно за доставчици на услуги в облака за съхранение, но има и базирана в облака модел, който позволява на потребителите да поддържат контрол върху своите данни. съхранение в облак е разработен в три посоки, една от които дава възможност за сливане на другите две, за да се постигне икономическа ефективност и безопасност.

Повечето от тази статия се фокусира върху доставчиците на публични облачни решения за съхранение, които осигуряват инфраструктурата на база наем (ресурси за дългосрочно или краткосрочно съхранение и пропускателна способност на мрежата). Частен облак използвате същия подход както на обществото, но по такъв начин, че инфраструктурата може да бъде здраво вградени в частна мрежа на потребителя. Накрая системи за съхранение на хибриден облак могат да се комбинират и двата модела, определянето на правилата, уреждащи какви данни искате да запазите в частна собственост, и това, което може да бъде защитен по силата на обществения облак (вж. Фиг. 6).

Фигура 6. облак модел съхранение

Фигура 6 показва графично модел облак. Броят на доставчиците на сторидж включва обществен облак на Amazon и Nirvanix (предложи съхранение като услуга). Примери за доставчици на системи за съхранение в частни складове са IBM, Parascale и Cleversafe (която предлага софтуер и / или оборудване за вътрешни облаци). И накрая, доставчици на хибриден облак - една Nirvanix, Egnyte и др.

заключение

съхранение в облак - това е една интересна посока на развитие на модела на склад, който ще открие нови възможности за изграждане, достъп и управление на системи за съхранение на данни в предприятието. Въпреки, че днес системата за съхранение облак - предимно потребителите технология, тя бързо се разви в посока на предприятието. Хибридните модели облачни позволяват на организациите да се запази конфиденциалността на данните си в рамките на местния център за данни, който минава на по-малко чувствителни данни в облака за намаляване на разходите и географското защита. Вижте ресурси за връзки с информация за доставчика на услуги и уникални технологии на облак съхранение.