Будущее в ДНК: Ученые создали «кассету» для хранения данных на столетия
Заканчивается память на телефоне? Не спешите расширять облачное хранилище. Ученые из Китая обнаружили, что изображения, текстовые файлы и другие цифровые данные можно хранить в цепочках ДНК, нанесенных на пластиковую ленту длиной 100 метров, способную вместить эквивалент 3 миллиардов песен.
Это огромный шаг вперед по сравнению с устройством, созданным Microsoft в 2016 году, которое умещало 200 мегабайт данных в капле искусственной ДНК «намного меньше кончика карандаша».
Новая «лента» даже может быть загружена в считывающее устройство, похожее на кассетный плеер, которое сканирует полосу, находит выбранный файл и извлекает его по запросу. Команда описала свои находки в исследовании, опубликованном 10 сентября в журнале Science Advances.
ДНК — это длинная двойная спираль, состоящая из уникальной последовательности четырех химических оснований — аденина (A), цитозина (C), гуанина (G) и тимина (T), — которые вместе кодируют генетическую информацию организма. Аналогично, любой цифровой файл — это, в конечном счете, комбинация единиц и нулей, которую компьютер интерпретирует как PDF, JPEG или другой формат.
Если каждое основание представить в виде определенного паттерна нулей и единиц, то искусственный фрагмент ДНК можно закодировать так, чтобы он содержал двоичный код цифровых файлов. Такая молекула не берется из живого организма, а собирается в лаборатории путем соединения заранее изготовленных нуклеотидных «кирпичиков» в нужной последовательности.
Именно это и сделали ученые, прежде чем нанести закодированную ДНК на длинную пластиковую ленту. Раствор, содержащий цепочки, пропускали по полосе, так что они адсорбировались на полимерной поверхности.
«ДНК обладает потенциалом стать носителем информации следующего поколения благодаря высокой плотности хранения», — написали авторы в исследовании. — «Рулонная конфигурация ДНК-ленты эффективно максимизирует использование пространства материала, обеспечивает портативность и увеличивает доступную площадь и емкость хранения за счет увеличения длины».
Каждый участок ленты помечен штрих-кодом, указывающим, какой файл там хранится. Камера на устройстве, похожем на кассетный плеер, сканирует ленту, когда она движется между двумя роликами, находит нужный файл и погружает этот участок в щелочной раствор, высвобождающий ДНК. Затем ДНК можно секвенировать, а последовательность оснований преобразовать обратно в цифровой код файла.
Хранение данных на сотни, если не тысячи лет
Исследователи надеются, что их ДНК-лента может стать решением проблемы взрывного роста объема цифровых данных, который сегодня многократно усугубляется бумом генеративного искусственного интеллекта (ИИ). Они подсчитали, что кусок ленты длиной примерно в 1 километр может вместить до 362 000 терабайт данных — эквивалент примерно 60 миллиардов фотографий. Для сравнения, ноутбуки часто поставляются с хранилищем от 0,5 до 2 ТБ, а смартфоны обычно имеют минимум 128 или 256 ГБ.
Помимо высокой емкости, данные, инкапсулированные в ДНК-ленте, могут сохраняться очень долго, заявила команда. Это потому, что цепочки ДНК хранятся внутри металл-органических каркасов (МОК) — молекулярных «клеток» из ионов цинка, которые обеспечивают защитный слой.
Известно, что ДНК сохраняет свою структуру веками, и исследователи обнаружили, что их лента может хранить данные более 345 лет при комнатной температуре или около 20 000 лет при 0 градусов Цельсия. Даже в случае разрыва ДНК-ленту можно починить с помощью прозрачного скотча, говорится в исследовании.
Помимо идентификации и извлечения цепочек ДНК, соответствующих конкретному файлу, считыватель может инкапсулировать новые цепочки ДНК в МОКи и наносить их на ленту. Он также может автономно определять, когда цепочка ДНК находится в секции с неправильным штрих-кодом, и перемещать ее в правильную.
Хотя хранение данных в ДНК изучается много лет, это одно из первых решений, демонстрирующих элегантное поведение «файловой системы», то есть файлы можно извлекать, изменять или удалять. Оно также работает автоматически, без необходимости ручных операций, и может обрабатывать как «горячие» (часто используемые), так и «холодные» (редко доступные) данные.
Вызовы и перспективы
Однако проблемы остаются. Синтез ДНК по-прежнему дорог, трудоемок и требует громоздкого оборудования. Кроме того, процесс извлечения одного файла с ленты занимает около 25 минут. Поэтому в своем нынешнем виде ДНК-кассетный плеер не предлагает жизнеспособного метода архивирования наших цифровых данных.
Тем не менее, ученые надеются, что их исследование может привести к созданию технологий, способных хранить огромные массивы как «горячих», так и «холодных» данных в компактной форме, снижая зависимость от массивных дата-центров, используемых сегодня. Это открывает путь к созданию архивов, которые переживут не одно поколение, и к фундаментальному изменению самой философии долговременного сохранения информации человечества.