В США биоинженеры "напечатали" книгу из 53 тысяч слов на молекулах ДНК, и прочитали ее при помощи устройства секвенирования, достигнув рекордной плотности записи информации на сегодняшний день.
Молекулы ДНК представляют собой надежное устройство по хранению информации, так как они хорошо защищены от ошибок чтения и записи.
Ученые пытаются приспособить их для хранения произвольных данных с 1988 года, когда американским биоинформатикам впервые удалось записать 7,9 килобайт информации на молекулу ДНК и прочитать ее.
Группа ученых под руководством Шрирама Косури из Гарвардской медицинской школы в Бостоне (США) разработала особый компьютерный алгоритм, позволяющий сжать и подготовить для записи на молекулу ДНК практически неограниченный объем информации.
В соответствии с данной методикой, данные разбиваются на куски одинаковой длины и записываются на короткие фрагменты ДНК длиной в 159 нуклеотидов. Каждый такой блок содержит 96 бит данных, 19 битный адрес блока и два фрагмента по 22 бита, кодирующих начало и конец "пакета" информации. В каждом случае один нуклеотид кодирует один бит данных - азотистые основания аденин (А) и цитозин (С) обозначают логическую "единицу", а гуанин (G) и тимин (T) - логический ноль.
При записи информации блоки синтезируются из отдельных нуклеотидов при помощи струйного ДНК-принтера. Наличие адреса у каждого блока позволяет хранить информацию в виде смеси из коротких последовательностей нуклеотидов, а не единой цепочки ДНК. Это позволяет хранить практически неограниченный объем информации, увеличивая длину адресной части блока.
Косури и его коллеги проверили свой алгоритм в деле, "напечатав" электронную версию книги Регенезис: как синтетическая биология переизобретет природу и нас самих, написанной участником группы Джорджем Черчем и писателем Эдом Реджисом.
В общей сложности, электронная версия книги содержит в себе 5,27 мегабит (658 килобайт) информации, в том числе 53,5 тысячи слов, 11 картинок и 1 ява-скрипт.
Ученые синтезировали необходимые фрагменты ДНК, смешали их, размножили и прочитали при помощи устройства секвенирования Illumina HiSeq.
По словам биоинженеров, алгоритм кодирования оказался очень эффективным - книга была считана всего с десятью ошибками на 5,27 мегабит данных.
По словам авторов исследования, их технология имеет несколько других преимуществ, кроме неограниченной длины записи и устойчивости к ошибкам. Во-первых, использование нуклеотидов в качестве единичных битов позволяет достичь невероятно высокой плотности записи - 5,5 петабит на кубический миллиметр. Это больше аналогичной характеристики для флеш-памяти и жестких дисков в миллионы раз, и в сотни раз превышает плотность записи данных в квантовой голографии.
Ученые полагают, что такие характеристики ДНК-памяти могут помочь ей стать одним из основных способов хранения информации в архивах и для других целей, не требующих быстрого доступа к данным.
Напомним, в июне текущего года для лечения рака американские химики создали наночастицы из ДНК и РНК, "выключающие" некоторые гены опухолевых клеток.
По материалам: РИА Новости
Инф. korrespondent.net