Mã hóa cả một cuốn sách bằng ADN

Hiệp Khách Quậy ... Xin mời đọc tiếp.

Một đội nghiên cứu ở Mĩ vừa mã hóa thành công một quyển sách 5,27 megabit bằng các vi chip ADN, sau đó họ đã đọc quyển sách bằng sự xâu chuỗi ADN. Thí nghiệm của họ cho thấy ADN có thể dùng để lưu trữ dài hạn thông tin kĩ thuật số.

George Church và Sriram Kosuri thuộc Viện Kĩ thuật Xúc tiến Sinh học Wyss thuộc trường Harvard, và các cộng sự, đã mã hóa quyển sách “Tái sinh” của Church gồm khoảng 53.400 từ vào những chuỗi ADN, cùng với 11 hình ảnh ở định dạng JPG và một chương trình JavaScript. Dữ liệu lần này cao gấp 1.000 lần dữ liệu đã mã hóa ở ADN trước đây.

Mã hóa cả một cuốn sách bằng ADN

Hình minh họa

ADN có cấu tạo gồm các nucleotide, và ít nhất trên lí thuyết mỗi nucleotide có thể dùng để mã hóa 2 bit dữ liệu. Điều này có nghĩa là mật độ lưu trữ là một triệu gigabit trên mỗi millimet khối, và chỉ cần 4 gram ADN trên lí thuyết là có thể mã hóa toàn bộ dữ liệu số được tạo ra mỗi năm. Mật độ này dày đặc hơn nhiều so với các phương tiện lưu trữ kĩ thuật số như ổ đĩa flash và bền hơn, vì các chuỗi ADN có thể được đọc lúc hàng nghìn năm sau khi chúng đã được mã hóa.

Sự thành công của thí nghiệm trên đặt chiến lược mã hóa dữ liệu vào những chuỗi ADN ngắn thay vì những chuỗi ADN dài, và như vậy sẽ làm giảm khó khăn và chi phí của việc đọc và ghi dữ liệu. Tiến sĩ Kosuri cho biết quá trình trên tương tự với việc ghi dữ liệu trên ổ đĩa cứng, trong đó dữ liệu được ghi thành những đơn vị nhỏ gọi là sector.

Lần đầu tiên họ đã chuyển định dạng một quyển sách, một chương trình và các hình ảnh sang định dạng HTML, sau đó dịch thông tin này thành một chuỗi gồm 5,27 triệu số 0 và 1, và sau đó 5,27 megabit này được xâu chuỗi thành đoạn của các nucleotide dài 96 bit, sử dụng một ADN nucleotide cho một bit. Các nucleotide base A và C mã hóa cho 0, còn G và T thì mã hóa cho 1. Mỗi đơn vị còn chứa một địa chỉ 19 bit mã hóa vị trí của đơn vị đó trong toàn chuỗi. Các bản sao bội của mỗi đơn vị được tổng hợp để giúp hiệu chỉnh sai sót.

Sau khi quyển sách và những thông tin khác được mã hóa vào ADN, các giọt ADN được gắn vào những con chip ma trận micro để lưu trữ. Các con chip đó được giữ ở 4oC trong ba tháng, sau đó đem đi hòa tan và xâu chuỗi. Mỗi bản sao của mỗi đơn vị nucleotide được xâu chuỗi lên tới 3.000 lần nên có thể đạt tới sự liên ứng. Theo cách này, họ giảm sai số bit trong 5,27 megabit xuống còn 10 bit.

Thao tác đó, được mô tả trong một bài báo đăng trên tạp chí Science, không thể dùng để ghi-lại dữ liệu (ghi lần hai) nhưng có thể dùng để lưu trữ dữ liệu rất lâu. Một ưu điểm của việc sử dụng ADN là mật độ thông tin lưu trữ có thể lớn hơn nhiều, nhưng một ưu điểm lớn nữa là ADN là một phân tử sinh học sẽ luôn luôn có thể đọc trên phương diện sinh học mà không cần một thiết bị đặc biệt nào như máy CD hay DVD, những cái có thể trở nên sớm lỗi thời.

Nhược điểm chính của hệ này là hiện nay các công nghệ dùng để tổng hợp và xâu chuỗi ADN là quá tốn kém nên không thực tế cho công dụng hàng ngày. Một vấn đề nữa là trong khi ADN đã được xâu chuỗi từ những nguồn như các xác ướp hàng nghìn năm tuổi, nhưng ADN có xu hướng bị phân đoạn, và cần có thêm nghiên cứu để cải tiến tính ổn định của ADN trong hàng thế kỉ hoặc lâu hơn.

Tham khảo: DOI: 10.1126/science.1226355

123physics (thuvienvatly.com)
Nguồn: PhysOrg.com

Mời đọc thêm