В молекулярной биологии ген кодирует белок через последовательность нуклеотидов в ДНК. Каждый аминокислотный остаток в белке кодируется триплетом нуклеотидов, называемым кодоном. Следовательно, для кодирования одной аминокислоты требуется три нуклеотида.
Если белок содержит 400 аминокислот, то минимальная длина гена, необходимая для кодирования этого белка, составит:
[ 400 \, \text{аминокислот} \times 3 \, \text{нуклеотида/аминокислоту} = 1200 \, \text{нуклеотидов} ]
Однако это минимальная длина кодирующей последовательности. В реальности гены часто содержат дополнительные нуклеотиды, которые выполняют различные функции:
Промоторные последовательности: участки ДНК, расположенные перед началом кодирующего региона. Они необходимы для инициации транскрипции.
Интроны и экзоны: в эукариотических организмах гены часто содержат интроны (некодирующие последовательности), которые вырезаются из пре-мРНК в процессе созревания мРНК. Экзоны — это кодирующие последовательности, которые остаются в зрелой мРНК.
UTR (некодирующие области): 5'- и 3'-нетранслируемые области (UTR) мРНК, которые не кодируют аминокислоты, но играют важную роль в регуляции трансляции и стабильности мРНК.
Терминаторы: последовательности, которые сигнализируют о завершении транскрипции.
Учитывая все эти элементы, реальная длина гена, контролирующего синтез белка из 400 аминокислот, будет больше 1200 нуклеотидов. Однако для точного определения длины гена необходимо знать его полную структуру, включая все некодирующие регионы и регуляторные элементы.