Główny dogmat biologii mówi, że informacja zakodowana w DNA jest przekazywana do informacyjnego RNA (mRNA), który następnie kieruje syntezą białka. Zestaw instrukcji, które umożliwiają dekodowanie sekwencji nukleotydów mRNA na aminokwasy, nazywa się kodem genetycznym. Uniwersalna natura tego kodu genetycznego pobudziła postęp w badaniach naukowych, rolnictwie i medycynie.
Na początku XX wieku naukowcy odkryli, że DNA przechowuje wszystkie informacje potrzebne do funkcji komórkowych i że białka pełnią większość tych funkcji. Jednak mechanizmy przekształcania informacji genetycznej w funkcjonalne białka pozostawały nieznane przez wiele lat. Początkowo uważano, że pojedynczy gen jest bezpośrednio przekształcany w kodowane białko. Dwa kluczowe odkrycia w komórkach eukariotycznych podważyły tę teorię: po pierwsze, produkcja białka nie odbywa się w jądrze. Po drugie, DNA nie jest obecne poza jądrem. Odkrycia te zapoczątkowały poszukiwania cząsteczki pośredniej, która łączy DNA z produkcją białek. Ta cząsteczka pośrednia, znajdująca się zarówno w jądrze, jak i cytoplazmie, i związana z produkcją białka, to RNA.
Podczas transkrypcji RNA jest syntetyzowane w jądrze, wykorzystując DNA jako matrycę. Nowo zsyntetyzowany RNA ma podobną sekwencję do nici DNA, z wyjątkiem tego, że tymidyna w DNA jest zastąpiona uracylem w RNA. U eukariontów ten pierwotny transkrypt jest dalej przetwarzany, usuwając niekodujące regiony białka, zamykając koniec 5′ i dodając ogon poli-A 3′, aby wytworzyć mRNA, które jest następnie eksportowane do cytoplazmy.
Translacja zachodzi w rybosomach w cytoplazmie, gdzie informacja zakodowana w mRNA jest tłumaczona na łańcuch aminokwasowy. Zestaw trzech nukleotydów koduje aminokwas, a te trojaczki nazywane są kodonami. Zestaw reguł, które określają, które kodony określają dany aminokwas, składa się na kod genetyczny.
Białka są tworzone z 20 aminokwasów u eukariontów. Połączenie czterech nukleotydów w zestawy po trzy daje 64 (4,3) możliwe kodony. Oznacza to, że możliwe jest, że pojedynczy aminokwas może być kodowany przez więcej niż jeden kodon. Mówi się, że kod genetyczny jest zbędny lub zdegenerowany. Często, ale nie zawsze, kodony, które określają te same aminokwasy, różnią się tylko trzecim nukleotydem trypletu. Na przykład kodony GUU, GUC, GUA i GUG reprezentują aminokwas walinę. Jednak AUG jest jedynym kodonem, który reprezentuje aminokwas metioninę. Kodon AUG jest również kodonem, w którym rozpoczyna się synteza białek i dlatego nazywany jest kodonem start. Redundancja w systemie minimalizuje szkodliwe skutki mutacji. Mutacja (tj. zmiana) w trzeciej pozycji kodonu niekoniecznie musi skutkować zmianą aminokwasu.
Z kilkoma wyjątkami większość organizmów prokariotycznych i eukariotycznych używa tego samego kodu genetycznego do syntezy białek. Ta uniwersalność kodu genetycznego umożliwiła postęp w badaniach naukowych, rolnictwie i medycynie. Na przykład insulina ludzka może być teraz produkowana na dużą skalę w bakteriach. Odbywa się to za pomocą technologii rekombinacji DNA. Rekombinowane DNA składa się z materiału genetycznego różnych gatunków. Geny kodujące ludzką insulinę są łączone z bakteryjnym DNA i wprowadzane do komórki bakteryjnej. Komórka bakteryjna przeprowadza transkrypcję i translację w celu wytworzenia ludzkiej insuliny kodowanej w rekombinowanym DNA. Powstała w ten sposób insulina ludzka jest stosowana w leczeniu cukrzycy.