rocha,andreasantosleiteda-doutorado

Upload: celina-d-avila-samogin

Post on 14-Jul-2015

75 views

Category:

Documents


0 download

TRANSCRIPT

UniversidadeEstadualdeCampinasFaculdadedeEngenhariaEletrica edeComputa caoDepartamentodeTelematicaModelodeSistemadeComunicacoesDigitalparaoMecanismodeImportacaodeProtenasMitocondriaisAtravesdeCodigosCorretoresdeErrosAutora: AndreaSantosLeitedaRochaOrientador: Prof. Dr. ReginaldoPalazzoJ unior(DT-FEEC/UNICAMP)Co-Orientador: Prof. Dr. MarciodeCastroSilvaFilho(ESALQ/USP)BancaExaminadora:Prof. Dr. ReginaldoPalazzoJ unior FEEC/UNICAMPProf. Dr. GeraldoPompeuJunior UFSCar/SorocabaProf. Dr. MaxHenriqueMachadoCosta FEEC/UNICAMPProf. Dr. WeilerAlvesFinamore PUC/RJProf. Dr. RomisRibeiroFaissol Attux FEEC/UNICAMPTeseapresentadanaFaculdadedeEngenha-riaEletricae de Computa caodaUniversi-dade Estadual de Campinas,como parte dosrequisitosexigidosparaaobten caodottulodeDoutor emEngenhariaEletrica.Campinas-SPFevereirode2010.Paraomeulho,HenriqueEsteban.Roubeitantashorasaoteuconvvioparapoderescreverestatese.Porissoelatepertence,meuamor.DedicoiAgradecimentos1Ao Prof. Dr. Reginaldo Palazzo J unior pela sua excelente orienta cao, disposi cao, pacienciaecompreensaoduranteodesenvolvimentodestetrabalho. Emespecial, `asuaamizadee`asuaconan cadepositadaemmim. Meugrandeexemplodehumildadeebondade. Sempremerecordarei, commuitocarinhoesaudades, dasnossasreunioesregadasamuitoscafes,das nossas agradaveis conversas e das boas risadas. Deixo com voce a minha eterna gratidao.Aomeuco-orientadorProf. Dr. MarciodeCastroSilvaFilhopelasnossasconversasepelaoportunidadedestaparceria.Aos professores membros da banca examinadora pela disponibilidade e aten cao dispensadaaotrabalho, bemcomopor suas valiosas sugestoes. Emparticular, `aprofessoraCarmenBertuzzopelocarinhocomquesemprenostratou.Ao Prof. Dr. Geraldo Pompeu Jr., pelo seu carinho e dedica c ao ao ensino da matematicanestepas. Emespecial pelomeuencaminhamentoaomundoacademico. Voceseraomeueternopadrinhoacademico.Ao Prof. Dr. Walter Borelli pelas otimas coversas sobre diversos assuntos, mas principal-mente, pelasotimasgargalhadas. Pe coaDeusqueconserveesteotimosensodehumortaopeculiar.AoDr. MarceloM. Brandaopelaajudanaescritadase caosobrelogeniaeporestarsempredispostoaajudar.Ao meu marido Gerson pelo seu constante apoio no decorrer deste trabalho. Em especialpelasuapaciencianosmomentosdifceis. Semasuacompreensaoecompanheirismoestetrabalhojamaisseriaconcretizado. Muitoobrigadaporseraminhaalmagemea.Aos meus pais, Maria e Antonio, por terem me ensinado a nunca desistir dos meus sonhos.A minha doce irma por sempre ter conado em mim e me elogiado em excesso. A admira caorecproca emaisqueverdadeira,tenhomuitoorgulhoemsersuairma.`Aminhagrandeamigairma, Luzinete, sempretaoqueridaeprestativadurantetodosestesanosdeconvivencia. Umadaspessoasmaisdignasecorretasquejaconheci. Estetrabalhosofoi possvel devido`asuaparceriae`asnossaslongasconversassobreomundobiologicoematematico. Comvocedeixoomeueternocarinho,amorerespeito.`Asminhasamigas, WanessaeClarice, pelosotimosmomentosemquepassamosestesanos. Por todos os nossos almo cos, cafes e batidinhas de pernas, principalmente porsempreteremmeajudadoquandoprecisei dando-mefor caparacontinuar. Claroquenao1Este trabalho foinanciado pelo Conselho Nacional deDesenvolvimento Cientco eTecnol ogico - CNPqiiipoderia me esquecer,da nossa hilaria visita `a clnica de reprodu cao humana. Guardo a nossaamizadenomeucora cao.Aosmeusamigos, JoaoHenriqueeGiuliano, meusdoisirmaozinhosquetornaramestajornadainesquecvel emuitoprazerosa. Comvocesdeixoasminhasmelhoresrecorda coes.`AminhaamigaLucilaporestarsempredispostaaajudar. Admiroasuadedica caoeasuacompetencia.AosfuncionariosdaFEECquedealgumaformacontribuiramparaarealiza caodestetrabalho. Em especial, a minha querida Noemia que tornou-se uma grande amiga no decorrerdestesanos.`AFAPESPpelosuportejuntoaoprojetotematico02/07473-7.Demodogeral, agrade coatodosmeusamigosecolegasque, diretaouindiretamente,contriburampararealiza caodestetrabalho.ivResumoUmdosdesaos embiologiamatematicaemostrar aexistenciadequalquer formadecodigoscorretoresdeerrosnaestruturadoDNA. Usandoosconceitosdateoriadecomu-nica cao, propomosummodeloparaosistemadecodica caoedecodica caodomecanismode importa cao de protenas mitocondriais similar a um sistema de comunica coes digital. Estemodelo consiste de um mapeador responsavel por transformar os nucleotdeos (A, C, G, T) noalfabeto (0, 1, 2, 3) usado pelo codigo sobre a estrutura de anel; um codicador (codigo BCH);e um modulador (codigo genetico, tRNA e rRNA). O processode decodica caobaseia-se emuma analogia entre o processode decodica caodo algoritmo Berlekamp-Masseypara aneis eo complexo TOM (complexo ancorado na membrana externa da mitocondria responsavel porauxiliarnaimporta caodasprotenasprecursoras). Nesteprocessotemosumdemodulador(protenas Tom 70 e Tom20), um decodicador (o complexo GIP - poro geral de inser cao) e oreceptor(subcompartimentomitocondrial). NestetrabalhomostramosqueassequenciasdeDNA(sequenciasdedirecionamento)saoidenticadascomopalavras-codigodeumcodigoG-linear sobre a extensaode um anel de Galois. Alem disso,essas sequenciasde DNA e suastas complementaresestao relacionadas matematicamente atraves dos polinomios primitivose seuspolinomiosrecprocos,respectivamente. UmestudologeneticosugerequeaprotenamalatodesidrogenasedaArabidopsisthalianaencontradanobancodedadosNCBIeumasequenciaderivadadaprotenamalatodesidrogenase reproduzidapelocodigocorretor deerros. Este modelotambem reproduz com notavel precisaoos parametros cineticosbaseadosemsubstitui coesdeaminoacidosemoligopeptdeossinteticos. Apresentamos, pelaprimeiravez, aexistenciadecodigoscorretoresdeerrosassociadoscomassequencias deDNA, osquaissugeremfortementeaexistenciadecodigosconcatenadosnogenoma. Osresultadosapresentados neste trabalhocontribuemparaodesenvolvimentodeumprocedimentosis-tematicoquepoderaserempregadoemanalisesdemuta c oes/polimorsmoscomaplica coesnaengenhariagenetica.Palavras-chave: Codigoscorretoresdeerros, codigoBCH, sequenciasdeDNA, trans-portedeprotenas,muta coes,polimorsmo.vAbstractOne of the puzzling problems in mathematical biology is to show the existence of any formoferror-correctingcodeintheDNAstructure. Usinginformationtheoryconsiderationsweproposeamodelforthebiologicalcodingsystemsimilartothatofadigitalcommunicationsystem. Thismodelconsistsofamapper(transformationsfromthesetofnucleotideseithertotheset(0,1,2,3) ring;anencoder(BCHcode);and amodulator (geneticcode,tRNA andrRNA). Thedecodingprocess isbasedontheModiedBerlekamp-Masseyalgothminananalogy withtheTOMcomplex(translocaseofthemitochondrialoutermembrane). Inthisprocess we have a demodulator (Tom 70 and Tom 20 proteins), a decoder (GIP complex) andthe receiver (mitochondrion). In this work we show that DNA sequences (targeting sequences)are identiedas codewordsof a G-linear code overGalois ringextensions. In addition, theseDNA sequences and their complementary strands are mathematically related to the primitivepolynomials and their reciprocal polynomials, respectively. A phylogenetic study suggest thattheMDHprotein, Arabidopsisthaliana,foundintheNCBIdatabankisaderivedsequenceof theMDHproteinreproducedbytheerrorcorrectingcode. Thismodel alsoreproduceswith remarkable accuracy kinetic parameters based on amino acid substitutions on syntheticoligopeptides. Weshow,forthersttime,theexistenceoferror-correctingcodesassociatedwith DNA sequences, which strongly infer on the existence of nested codes within the genome.Theresultspresentedinthisworkcontributetothedevelopmentofasystematicprocedurewhich may be employed in the mutations/polymorphisms analysis with applications in geneticengineering.Key-words: Error correctioncode , BCHcode, DNAsequences, transport proteins,mutations,polymorphisms.viiConte udoDedicatoria iAgradecimentos iiiResumo vAbstract viiListadeFiguras xiiListadeTabelas xv1 Introducao 11.1 OsAvan cosHistoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 ModelosPropostosnaLiteratura . . . . . . . . . . . . . . . . . . . . . . . . 31.2.1 Propostadeummodelodecomunica caogeneticaparaaimporta caodeprotenasorganelares . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Apresenta caodoProblema. . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4 Descri caodoTrabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 ElementosdeBiologiaeCodigosCorretoresdeErros 132.1 Importa caodeProtenasOrganelares . . . . . . . . . . . . . . . . . . . . . . 132.1.1 AMoleculadeDNA . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.2 Importa caodeProtenasemMitocondrias . . . . . . . . . . . . . . . 172.1.3 Muta coes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.2 CodigosCorretoresdeErros . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2.1 EstruturasAlgebricas. . . . . . . . . . . . . . . . . . . . . . . . . . . 322.2.2 Aneis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362.2.3 Codigos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402.2.4 CodigosGeometricamenteUniformes . . . . . . . . . . . . . . . . . . 44ixConte udo2.2.5 CodigosCclicosSobreAneisdeInteirosResiduais. . . . . . . . . . . 482.2.6 CodigosBCHsobreAneis . . . . . . . . . . . . . . . . . . . . . . . . 522.3 Decodica caodoCodigoBCHsobreAnel . . . . . . . . . . . . . . . . . . . . 552.3.1 OProcessodeDecodica cao. . . . . . . . . . . . . . . . . . . . . . . 562.3.2 Gera caodeSequencias . . . . . . . . . . . . . . . . . . . . . . . . . . 653 ModelodeumSistemadeComunicacaoparaaImportacaodeProtenasOrganelares 693.1 AnalogiasentreumSistemadeInforma caoGeneticaeumSistemadeComu-nica cao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 693.1.1 Odogmacentraldabiologiamolecular . . . . . . . . . . . . . . . . . 693.1.2 Odogmacentraldateoriadecomunica coes . . . . . . . . . . . . . . 713.1.3 Analogiasentresistemadeinforma caogeneticaeosistemadecomu-nica coes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.2 PropostadeumSistemadeComunica caoparaaImporta caodeProtenas . . 733.2.1 Sistemadecomunica caodigital . . . . . . . . . . . . . . . . . . . . . 733.2.2 Sistemadecomunica caobiologico . . . . . . . . . . . . . . . . . . . . 743.2.3 Ocodigoeaestruturamatematica . . . . . . . . . . . . . . . . . . . 763.2.4 Parametrosdocodigo. . . . . . . . . . . . . . . . . . . . . . . . . . . 773.2.5 Modelodosistemadecomunica caobiologico . . . . . . . . . . . . . . 784 GeracaodasSequenciasdeDirecionamento 834.1 AlgoritmodeCodica cao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 844.2 ResultadosdaCodica cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 934.2.1 Dependencia entre os codigos corretores de erros e os polinomios prim-itivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.2.2 RotulamentodassequenciasdeDNA . . . . . . . . . . . . . . . . . . 944.2.3 Rela caomatematicaentreastascodanteenaocodante . . . . . . . 954.2.4 Altouxodeinforma cao-baixaredundancia . . . . . . . . . . . . . 964.2.5 Classica caodassequencias dedirecionamentosobopontodevistamatematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 975 RegeneracaodeSequenciasdeDNA 1075.1 AlgoritmodeDecodica cao . . . . . . . . . . . . . . . . . . . . . . . . . . . 1085.2 ResultadosdaDecodica cao . . . . . . . . . . . . . . . . . . . . . . . . . . . 1165.3 Reprodu caodasSequenciasdeDNAatravesdoLFSR. . . . . . . . . . . . . 118xConte udo6 AnalisesdeMutacoesedePolimorsmosemSequenciasdeDNA 1256.1 AnalisesdaImportanciadosResduosdeArgininas . . . . . . . . . . . . . . 1266.1.1 Resultadosdasanalisesvialaboratorio . . . . . . . . . . . . . . . . . 1276.1.2 Resultadosdasanalisesviacodigoscorretoresdeerro . . . . . . . . . 1286.2 EstudodeFilogenia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1306.3 Simula coesdeMuta coesemSequenciasdeDirecionamentoMitocondriais . . 1337 ConclusoesePerspectivasFuturas 1437.1 DesenvolvimentodoTrabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 1447.2 Contribui coesdoTrabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1457.3 PropostasFuturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1467.4 Considera coesFinais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147ReferenciasBibliogracas 148xiListadeFiguras1.1 Teoriadainforma caobaseadanomodelodeRoman-Roldan. . . . . . . . . . 61.2 ModelopropostopelaMay,[3]. . . . . . . . . . . . . . . . . . . . . . . . . . 61.3 Modelodeumsistemadecomunica caoparaaimporta caodeprotenas or-ganelares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.1 Formastautomericasdasbases. . . . . . . . . . . . . . . . . . . . . . . . . . 152.2 EstruturatridimensionaldoDNA. . . . . . . . . . . . . . . . . . . . . . . . . 162.3 FitascomplementaresdeDNA. . . . . . . . . . . . . . . . . . . . . . . . . . 162.4 Micrograaeletronicadeumamitocondria. Lodishetal.,MolecularCell Bi-ology,5thEdition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.5 Ostransloconsdeprotenasnamitocondria. Pfanneret al., AssemblingtheMitochondrial Outer Membrane, Nature Structural &Molecular Biology,Vol. 11,pp. 1044-1048, 2004. . . . . . . . . . . . . . . . . . . . . . . . . . . 202.6 OcomplexoTOM. Dekkeret al., PreproteinTranslocaseof theOuterMito-chondrial Membrane: MolecularDissectionandAssemblyoftheGeneral Im-portPoreComplex,MolecularandCellularBiology, Vol. 18, pp. 6515-6524,1998. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.7 O complexo TIM23. Mokranjac, etal., Proteinimport intomitochondriaBio-chemicalSociety,Vol. 33,pp. 1019-1023, 2005. . . . . . . . . . . . . . . . . . 222.8 Diferentesrotasparaaimporta caodeprotenasmitocondriais. Lodishetal.,MolecularCellBiology,5thEdition.. . . . . . . . . . . . . . . . . . . . . . . 242.9 Importa caodeprotenasparaointeriordamatriz. Lodishet al., MolecularCell Biology, 5thEdition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.10 Importa caodeprotenas paramembranaexterna. Pfanner, AssemblingtheMitochondrialOuterMembrane,NatureStructural&MolecularBiology,Vol.11,pp. 1044-1048. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.11 Importa cao de protenas para o espa cointermembranas. Lodish etal.,Molec-ularCell Biology, 5thEdition. . . . . . . . . . . . . . . . . . . . . . . . . . . 27xiiiListadeFiguras2.12 Importa caodeprotenasparaamembranainterna. Lodishetal., MolecularCellBiology,5thEdition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.13 LFSR(linearfeedbackshift-register)decomprimentoL. . . . . . . . . . . 663.1 Dogmacentraldateoriadecomunica coes. . . . . . . . . . . . . . . . . . . . 713.2 Modelodeumsistemadecomunica coesdeinforma caogenetica. . . . . . . . 733.3 Diagramadeblocosdeumsistemadecomunica cao. . . . . . . . . . . . . . . 743.4 Modelodeumsistemadecomunica caoparaimporta caodeprotenas. . . . . 753.5 Sistemadecomunica coesdigital. . . . . . . . . . . . . . . . . . . . . . . . . . 783.6 Modelopropostoparacodica caobiologica. . . . . . . . . . . . . . . . . . . 793.7 Modelopropostoparadecodica caobiologica. . . . . . . . . . . . . . . . . . 804.1 RotulamentosA,BeC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954.2 Rela cao entre a dupla ta do DNA. O codigo faz a leitura das palavras-codigosnosentidodaesquerdapara`adireita. Acorvermelhaindicaondeocorreuadiferen cadenucleotdeos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 964.3 Rela caoentre as tas codante e naocodante. Ocodigofaz aleituradaspalavras-codigos no sentidoda esquerdapara `a direita. A cor vermelhaindicaondeocorreuadiferen cadenucleotdeos. . . . . . . . . . . . . . . . . . . . . 975.1 SDNCBIemSDreproduzidapelocodigo. . . . . . . . . . . . . . . . . . . . 1165.2 SDreproduzidapelocodigoemSDNCBI. . . . . . . . . . . . . . . . . . . . 1175.3 Fitascodanteenaocodante. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1175.4 Vetoru. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1205.5 Vetoru. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1215.6 LFSRtacodante5para3. . . . . . . . . . . . . . . . . . . . . . . . . . . 1225.7 LFSRtanaocodante5para3. . . . . . . . . . . . . . . . . . . . . . . . . 1225.8 Fitacodante5para3.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1225.9 Reprodu caoatravesdoLFSRdatacodante5para3. . . . . . . . . . . . 1236.1 Peptdeoreproduzidonostresrotulamentos. . . . . . . . . . . . . . . . . . . 1296.2 SequenciareproduzidapelocodigoBCH. . . . . . . . . . . . . . . . . . . . . 1296.3 Phenogram inferred using the Neighbor-Joining method with the evolutionarydistances computed using the Jukes-Cantor model. The percentage of replicatetrees in which the associated taxa clustered together in the bootstrap test (1000replicates).. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1326.4 Phylogenetic tree inferred by Bayesian analysis from the data set. Values closetothebranchesindicateBayesianposteriorprobability... . . . . . . . . . . . 133xivListadeTabelas2.1 Arranjopadrao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434.1 M=mitocondria,C=cloroplasto,RE=retculoendoplasmatico. . . . . . . 844.2 ElementosdeF64emnota caoder-uplas . . . . . . . . . . . . . . . . . . . . 864.3 ElementosdeGR(4, 6) emnota caoder-uplas . . . . . . . . . . . . . . . . . 874.4 ElementosdeG63. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 884.5 Rela caoentreaslinhasdamatrizPeas24permuta coes. . . . . . . . . . . . 914.6 Codigos BCHsobre GR(4, 6). Polinomios primitivos da extensao r =6:p1(x) = x6+x+1, p2(x) = x6+x5+x2+x+1,p3(x) = x6+x5+x3+x2+1,p4(x) = x6+x4+x3+x +1, p5(x) = x6+x5+x4+x+1 e p6(x) = x6+x5+1. 985.1 TabeladeDecodica cao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1105.2 TabeladeDecodica cao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1115.3 TabeladeDecodica cao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1135.4 Complementares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1155.5 Sequenciasdedirecionamentocomumaclassedesndrome. Fitacodante5para3etanaocodante3para5. . . . . . . . . . . . . . . . . . . . . . . 1185.6 Sequenciasde direcionamentocom duas classesde sndromes. Fita codante 5para3etanaocodante3para5. . . . . . . . . . . . . . . . . . . . . . . 1185.7 Sequenciasdedirecionamentocomumaclassedesndrome. Fitacomplemen-tarinvertida5para3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1185.8 Sequenciasdedirecionamentocomduasclassesdesndromes. Fitacomple-mentarinvertida5para3. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1196.1 Extensoespeptidasesanalisadas. . . . . . . . . . . . . . . . . . . . . . . . . . 1276.2 Efeitosdassubstitui coes dosresduosdeargininasporalaninaselisinasnaclivagempelaMPP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1286.3 Efeitosdassubstitui coes dosresduosdeargininasporalaninaselisinasnaclivagempelaMPPatravesdecodigoscorretoresdeerros. . . . . . . . . . . 130xvListadeTabelas6.4 Resultadosdassubstitui coesdosresduosdeargininas. . . . . . . . . . . . . 1366.5 Resultadosdassubstitui coesdosresduosdeargininas. . . . . . . . . . . . . 1386.6 Resultadosdassubstitui coesdosresduosdeargininas. . . . . . . . . . . . . 1396.7 Resultadosdassubstitui coesdosresduosdeargininas. . . . . . . . . . . . . 1406.8 Resultadosdassubstitui coesdosresduosdeargininas. . . . . . . . . . . . . 142xviCaptulo1Introdu caoEmbora nao aparentamestar relacionadas, tanto a teoria de comunica coes quanto ageneticapreocupam-secomatransferenciadainforma c ao. Alemdofatodequeateoriadecomunica coeserealizadapelohomemeageneticaporumprocessonatural,ambasdiferementresi, principalmente, pornaooperaremnamesmadimensao. Ateoriadecomunica coesestaprogramadaparaenviarmensagensnoespa co,deumlugarparaoutro,enquantoqueageneticaestaprogramadaparaenviarmensagensheredit ariasnotempo[1].Osucessoconsideraveldatecnologiadecomunica caocontacomoprogressosignicativona concep cao de dispositivos fsicos mas tambem, embora muito menos perceptvel, no desen-volvimentodeumpoderosoferramental conceitual, consistentementegarantidopeloteoriadainforma cao. Emboraesseferramental tenhasidooriginalmentedesenvolvidoparaaco-munica caoatravesdoespa co, esucientementeabrangenteparaaplica caonacomunica caoatravesdotempo[1].Aquestaocentralpodesercolocadadaseguintemaneira: Aestruturateoricaelaboradapelohomempodecontribuirparaumamelhorcompreensaodosprocessosnaturaisqueen-volvemacomunica caogenetica? Arespostaesim. Aperspectivaprovidaprincipalmentepelateoriadainforma caorenovaavisaoquepodemosterdomundovivo[1].1.1 OsAvan cosHistoricosEm meados do seculo XX ocorreram grandes avan cos tanto na engenharia de comunica caoquantonaengenhariagenetica. Em1953,aestruturadeduplahelicedoDNAfoidecifradapor James Watson, Francis Crick, Maurice Wilkins e Rosalind Franklin. Com esta descobertacouclaroqueainforma caogeneticaestaarmazenadanaformadeduastasdiretamentecomplementarescompostasporletrasdeumalfabetodequatrosmbolos. Ateadescobertadasbases moleculares dagenetica, ospesquisadores concentravam-senageneticaclassica,1Captulo1. Introdu caobaseadanasleisdahereditariedadepropostaspelomongeaustracoGregorMendel.Em1940,ClaudeElwoodShannonemsuatesededoutoradodesenvolveuumapropostasobre rela coes matematicas ligadas `a genetica Mendeliana, com o objetivo de esclarecer comodiferentescombina coesdecaractersticassepropagaramatravesdevariasgera coes. Apesardotrabalhoser muitooriginal naquelaepoca, ofatodenaoter sidopublicado, otornoupoucoconhecidoedivulgado. Aposterconcludoasuatesededoutorado,Shannondesviouseufocoparaacomunica caodigitalecriptograa.Em1948, Shannonestabeleceuateoriafundamental deumsistemadecomunica caodi-gital, introduzindo o conceito de informa cao baseado somente na caracterstica estatstica dafonte de informa cao, denindoa informa cao de maneira abstrata independenteda semanticaque nao diferencia texto, vdeo ou audio como era geralmente feito naquela epoca nos estudosdesistemas decomunica cao. Usandotal deni caodeinforma cao, Shannonprovouqueamensagem gerada por uma fonte de informa cao pode ser compactada ate o limite da entropiadafonte (teoremade codica caode fonte) e quee possvel codicar amensagemde talmaneira que possamos transmiti-la livre de erros com uma taxa maxima que o canal permite(teoremadecodica caodecanal). Desdeentao, aengenhariadecomunica coestemcriadoalgoritmoseestrategiasparaatingiroslimitantesdestesdoisteoremaseconsequentementerealizandograndesavan costecnologicos.Aelucida caodaestruturadoDNApossibilitoudescobertas fundamentais nabiologiacelularemolecular. EssasdescobertasrevolucionaramacienciadavidaeproporcionaramodesenvolvimentoemtecnologiasdeDNArecombinanteeolan camentodasind ustriasbio-tecnologicas. Poroutrolado, Shannonestabeleceuateoriafundamental deumsistemadecomunica cao digital. A sua teoria ocasionou um impacto enorme em nosso cotidiano levandoprincipalmenteaodesenvolvimentodoscelulares,dainternetedoscomputadores.SusanHockeld, presidentedoInstitutoTecnologicodeMassachusetts (MIT), emumeditorial daSciencevol.323de27/02/2009comenta: Theserevolutions showedtheseedsof athirdrevolutionthat linksthelifescienceswithengineeringandthephysical sciencesinpowerful newways. Manyof molecular biologys founders camefromthephysical sci-ences, bringingtobiologynewanalytical strategiesandtechnologies. Withtheevolutionofdata and technology-based biology, biologists worked increasingly closely with mathematicians,engineers,andphysicalscientists.Historicamente, aaplica caodateoriadainforma caoparaanalises de dados geneticosiniciou-senadecadade1970, poremessesesfor cosnaotiveramsucesso. Aposalgunsanos,oaumentodedadosgeneticos despertounovamenteointeressenaaplica caodateoriadainforma cao ao estudo do genoma. Esse segundo perodo de pesquisas continua ate o presentemomento, poremcomumn umeromuitoreduzidodepesquisadores. Os trabalhos atual-2Captulo1. Introdu caomentebuscamanalogiasentreouxodeinforma caobiologicaeosistemadecomunica cao,dividindo-sebasicamenteemtreslinhasdepesquisas: teoriadainforma caogenetica, teoriadacomunica caogeneticaeateoriadacodica caogenetica.Aaplica caodasteoriasdainforma cao, comunica caoecodica caoemsistemasbiologi-coscontribuemparaumamelhorcompreensaodosparadigmasbiologicosfazendocomqueabiologia, quehojeeumacienciadescritiva, setransformeemumacienciafundamentadateoricamente. Poroutrolado, osavan cosdasteoriasdainforma cao, comunica caoecodi-ca caopodemseralcan cadosatravesdacompreensaodosistemadeinforma caobiologico.Estanovaabordagem emuitopromissorapodendoproporcionarvariosavan cos,taiscomo:Identicarsistemasbiologicosquepodemserinvestigadosexperimentalmenteusandoasteoriasdainforma cao,comunica caoecodica cao;Usar a quantidade de dados e experiencias disponveis para testar a aplica cao das teoriasdainforma cao,comunica caoecodica cao;Compreendercomoasinterferenciasafetamossistemasbiologicos;Descobrir como as hipoteses dateoriadainforma caoe codica caopodemser mo-dicadasouexibilizadasparaaplica-lasemsistemasmoleculares;Compreender comoacodica caomultidimensional egeradaeusadaemprotenaseoutrasestruturasbiologicas;Comoas teorias dainforma cao, comunica caoecodica caopodemexplicar ospara-metrosdeintera caobiologicaentremoleculas, sendoquetaisparametrospodemserusadosnaconstru caodomaisaltonveldeumsistemabiologico;Acria caodenovastecnicasdecodica caoqueaproximamacapacidadedocanalparauma aplica cao molecular tanto em nvel nanotecnologico quanto em nvel macroscopico.1.2 ModelosPropostosnaLiteraturaA deni caoda informa cao baseada somente em caractersticas estatsticas da fonte de in-forma cao e tambem aplicada em dados geneticos. Recentes avan cos na tecnologia de sequen-ciamentodoDNAfornecemdadossucientesparaaplicarembiologiamolecular,oconceitogeral deinforma caopropostoporShannon. Nos ultimosanos, motivadospeladisponibili-dadedeumaquantidademuitograndedesequenciasgenomicasembancosdedados,variospesquisadoresemteoriadainforma caoedacodica caorealizampesquisasemduasfrentes,3Captulo1. Introdu caoa saber: 1) sob o ponto de vistada teoria da informa cao, aplicar os conceitosinerentesdestacomoobjetivodeapresentarummetodosistematicodedetermina caodasregioescodantesenao-codantesnaestruturadoDNA(problemadecodica c aodefonte); 2)sobopontodevistadateoriadacodica cao,fornecerafundamenta caonecessariaparaacaracteriza caodecodigoscorretoresdeerros(problemadecodica caodecanal).Todavia, sob o ponto de vista da teoria de comunica cao, as pesquisas concentram-se maisnoaspectodeadapta caodomodelotradicional deumsistemadecomunica caodigital, emtermosdediagramadeblocos,`aqueledosistemabiologicoporconsiderarqueainforma caocontidanogenoma(estruturadoDNA)sedaatravesdepacotesdeinforma caocontendoregioes com sequencias relacionadas a sincronismo, identica cao de pacotes, codicantes, naocodicantes,etc.Combase nasemelhan caentre ouxodeinforma caobiologicaeosistemadecomu-nica cao, variosmodelosforampropostos. Schneiderem[50, 51, 52], apresentaumprocedi-mento sistematico para identicar as regioes codantes e nao codantes nas sequencias de DNAutilizandoconceitos dateoriadainforma cao. Yockeyem[53], apresentouummodelodesistemadecomunica caodigitalassociadoaodaexpressaogenica. Forsdykeem[54,55]con-siderouapossibilidadedequeosintronspoderiamserosdgitosdeverica caodeparidadeassociadosaosexons. Poroutrolado,Rzeszowska-Wolny, [56],proposqueumarranjoapro-priadodoDNAemnucleosomospodeserrelevanteparaaoperacionalidadedestesistema.Liebovitchem[57], proposumprocedimentoquetornapossvel determinarseumtipodecodigocorretordeerroestapresenteounaonasequenciadoDNA.Rosenem[58] apresen-touummetodoparaadete caodecodigosdeblocolinearesqueexplicaapossibilidadedeinser coesedele coesnassequenciasdeDNA. Battail, [59], argumentasobreaexistenciadecodigos entrela cados no DNA, uma vez que o tamanho do genoma humano e muito maior queonecessarioparaespecicarascaractersticasde cadaindivduo. Mayem[60], proposousodecodigosdeblocoeconvolucionalnoprocessodeinicializa caodatradu caoemorganismosprocariontes. Mac Donnaill em [61], propos um codigo de verica cao de paridade relacionado`acomposi caodosnucleotdeos. Sanchez, [62], proposaconstru caodeumespa covetorialassociadoaocodigogeneticotendocomoestruturamatem aticaocorpodeGaloiscom64elementos, identicandocadaaminoacidocomumasequenciabinaria, possibilitandodessaforma uma caracteriza cao geometrica associada ao codigo genetico. A abordagem destes dois ultimosartigosestarelacionadaexclusivamentecomoc odigogenetico.Umaquestao sempre presente namaioriados trabalhos relacionados comcodica caogenomicaeaseguinte: Existealgumaformadecodigocorretor deerros naestruturadoDNA?Todavia,ostrabalhoscitadosanteriormentenaoforamcapazesdefornecersubsdiossobreaexistenciadecodigoscorretoresdeerrosnassequenciasdeDNA.4Captulo1. Introdu caoO presente trabalho encaminha, de maneira positiva, uma resposta a essa pergunta. Nestetrabalhoatuamosemduaslinhasdepesquisa: teoriadacomunica caogeneticaeateoriadacodica caogenetica. NaSubse cao1.2.1mostramos os principais modelos relacionados `ateoriadacomunica caogeneticae apresentamosas diferen casentreestesmodeloseo modelopropostonestetrabalho.1.2.1 Propostadeummodelodecomunica caogeneticaparaaim-porta caodeprotenasorganelaresNa literatura existem alguns trabalhos que exploram as semelhan casentre um sistema decomunica coes e a biologia molecular com o objetivo de modelar os diversos sistemas biologicos.Nestasubse cao, apresentamos doismodelos paraosistemas decomunica coes biologicoseevidenciamosasdiferen casentreestesmodeloseomodelopropostonestetrabalho.Omodeloapresentadoem[2] consiste emmodelar oprocessobiologicorelacionado`asntesedeprotenas, enquantoqueem[3]oobjetivoeinterpretaromecanismodeinicia caodatradu caoemorganismosprocarioticos. Nopresentetrabalhopropomosummodelorela-cionadoaomecanismodeimporta caodeprotenasorganelaresexistentesemorganismoeu-carioticos. Este modeloe usadoneste trabalhoparaanalisar aimporta caode protenasmitocondriais, porempodeser usadoparaanalisar aimporta caode protenas emoutrasorganelas,taiscomo,ocloroplastoeoretculoendoplasmatico.Evidenciamosqueapesardostresmodelos, citadosanteriormente, abordaremprocessosbiologicosdistintostodososmodelospossuemumpontoemcomum,oprocessorelacionado`asntesedeprotenas. Esteprocessorecebeumainterpreta caodiferenteemcadaumdosmodeloscitados.Em [2], Roman-Roldan sugere que o incio da vida pode ser caracterizado pela habilidadedeprocessamentodainforma cao, destaforma, analisesbaseadasnainforma caopodemserusadas emseus estudos. Ousodateoriadainforma caoemdados geneticos exige umaredeni caodosistemageneticocomoumsistemadeinforma cao. DeacordocomRoman-Roldan: theprocessingofbiologicalinformationhasanarticial parallel: theprocessingofinformationbycomputers. Asntesedeprotenaspodeserconsideradacomoumsistemadeprocessamentodainforma caopermitindoqueassequenciasdenucleotdeospossamseranalisadas como mensagens nao considerando elementos fsico-qumicos para o processamentodainforma cao. Atransferenciadainforma caobiologicapodesermodeladaporumsistemade comunica caoconsiderandoa sequenciade DNA como a entrada do canal e a sequenciadeaminoacidosqueestanaformadeprotenacomoasadadocanal,Figura1.1.Ocanal de comunica caopropostopor Roman-Roldanem[2] difere domodeloinicial5Captulo1. Introdu caoCdigoGenticoCanal(Entrada)DNA(Sada)ProtenaFigura1.1: Teoriadainforma caobaseadanomodelodeRoman-Roldan.proposto por May em [3]. Neste modelo o RNA mensageiro (mRNA) e denido como a sadado canal de comunica caoe e incorporado um decodicador que traduz o mRNA em protenaformandoacadeiadeaminoacidos. Roman-Roldanestabeleceoprocessodemapeamentodoscodonsparaaminoacidoscomoocanal detransmissaoatravesdoqual asequenciadeinforma caoinseridanoDNArelativa`aprotenaeenviadaeaprotenaerecebida. Omo-deloinicial deMayestabeleceocanal geneticocomosendoconstitudopelosprocessosdereplica caoe transcri caoduranteos quaiserros saointroduzidosnasequenciadenucleotdeo,Figura1.2.Codificador GenticoDecodificador GenticoInformaoGenticaProtena:InformaoRecebida.mRNADNACanalGentico.errosReplicaoTranscrioTraduoFigura1.2: ModelopropostopelaMay,[3].Em [2] a fonte de informa caogenetica e denidacomoumafonte ergodicaque geramen-sagensatravesdeumalfabetonito. Umafonteergodicaeumafontequeusaumcriteriodesele caoaleatoriaegeramensagenstpicaseatpicas. Mensagenstpicasouestatistica-mente homogeneas sao geradas com alta probabilidade, enquanto que mensagens atpicas saogeradascombaixaprobabilidade.Omodeloproposto nopresentetrabalhodiferencia-sedosmodelos anteriormentecitadosemvariosaspectos. Nestemodeloincorporamosumcodicador eummodulador, Figura6Captulo1. Introdu cao.MCSequnciaemnucleotdeosRibossomoCdigoGenticoG-LinearCodificadorModuladorConstelao deSinaisCdigoBCHMapeamento Fonte.RNAtSequnciaemaminocidosFigura1.3: Modelo de umsistema de comunica cao paraa importa caode protenas or-ganelares.1.3. Apalavra-codigonasadadocodicador estaassociada`asequenciadenucleotdeos(mRNA), enquantoqueasadadomoduladorestaassociada` asequenciadeaminoacidos(protena). Emboraomapeamentoentreocodoneanti-codon(codigogenetico), realizadopeloRNAtransportadorsejabemconhecidonocontextobiol ogico, omesmonecessitadeumacaracteriza caomatematicanocontextodeumsistemadecomunica caodigital.Nocontextodesistemadecomunica caodigital existeumprocessomuitosimplesee-cientequeechamadodemapeamentocasado(MC). Essapropriedadematematicaimplicaque a estrutura algebrica do codicador seja a mesma, a menos de um isomorsmo,que a daconstela caode sinais,garantindoassim,a menor complexidadepossveldo sistema. A classede codigos satisfazendoessa propriedade e bem conhecida e denominadacodigos geometrica-mente uniformes. Umasubclasseimportante e a dos codigos G-lineares,onde G denota umaestruturaalgebrica,queincorporatodasasvantagensinerentesaoprocessodegera caoededecodica caodoscodigoslineares,bem como,adoscodigosnaolinearesatravesdainser caodoblocomapeamento. Dependendodaclassica caodessemapeamentocomolinearounaolinear, o codigo resultante sera linear ou nao linear, respectivamente. Portanto, o codicadorconsistedeumblocomapeamentoeumcodicadordeumcodigocorretordeerros(blococodigoBCH).Omoduladorconsistedocodigogenetico, doRNAtransportadoredoRibossomo. Ocodigogeneticopodeservistocomoumsinal deconstela cao, ondecadacodoneconside-radocomoumaconstela caodesinais, oRNAtransportadorrealizaomapeamentocasado,enquanto que o RNA ribossomico se comporta como um processador digital de sinais, Figura7Captulo1. Introdu cao1.3.De uma forma geral, podemos considerar as seguintes semelhan cas entre os modelos apre-sentadosanteriormente. Nostresmodelos,aocorrenciadeumdosnucleotdeos(A, C, G, T)edenidacomoequiprovavel, p(A)=p(C) =p(G)=p(T)=1/4,eocanal detransmissaoesupostoestacionarioesemmemoria. Em[2]enopresentetrabalhoocanalestalivredasinterferencias,ouseja,livredasmuta coesgeneticas. Nomodelodescritoem[3]osproces-sosdereplica caoetranscri caoocorremnocanal queestasujeitoaerros(interferencias).Outropontoaserconsideradoeafontedeinforma caogeneticaqueedenidacomoumafonteergodicanestetrabalhoeem[2].Ograndediferencial domodelosendopropostoestanapossibilidadedeidenticarumaestruturamatematicabemdenidanas sequencias deDNAreproduzidas. Enquantoqueos demais modelos utilizamumprocessoestatsticoparaanalisar as sequencias de DNAdeacordocomointeresseemquestao, omodelodopresentetrabalhoutilizaumprocessodeterminsticopararealizartaisanalises. Ateondeedenossoconhecimento, nomomentonaoexisteummetodomatematicoqueanalisedeterministicamenteassequenciasdeDNA.1.3 Apresenta caodoProblemaPesquisadores que atuamnas areas dabiologiamolecular utilizandoos conceitos dasteorias da informa cao, da codica cao e da comunica cao, consideram um dos grandes desaosmostraraexistenciadecodigoscorretoresdeerrosnaestruturadoDNA. Em[59], Battailapresenta duas hipoteses declarando: The survival of anorganism necessitates theexistenceof areliableinformationreplicationprocess. Thereforeerror-correctingcodesmust beusedinreplicationorinanotherprocessof informationregenerationthat precedesreplication;Thegeneticinformationundergoesnestedencoding,wheretheresultofapreviousencodingprocessiscombinedwithnewinformationandencodedagain. Themoreimportant geneticinformationisassumedtobeintheprimarycodedmessage,regardingnestedcodingmirrorscodingtheorysconceptofconcatenatedcodeswhicharealsocallednestedcodes.Nopresentetrabalhoconsideramosasduashipoteses, apresentadasanteriormente, comalgumas restri coes. Neste momento ao inves de analisarmos o processo de replica cao do DNAcom o objetivo de mostrar a existencia de codigos corretores de erros no genoma, o que torna oproblema muito complexo, estabeleceremos a seguinte conjectura: Se o genoma e constitudoporregioesconsistindodeexons, introns, sequenciasdedirecionamento, promoteres, DNArepetitivos, etc, e que cada uma dessas regioes pode ser reproduzida por um codigo especco,entaoogenomaconsistedecodigosconcatenados(nestedcodes)nomnimojustapostos.Um problema biologico de grande interesse cientco, que satisfaz a conjectura de codigos8Captulo1. Introdu caoconcatenados, e omecanismode importa caode protenas mitocondriais. Neste processoexistemasprotenasprecursorasquesaodirecionadasparaasmitocondriasatravesdeumasequenciade direcionamentopresente naposi caoN-terminal das protenas. Podemos in-terpretarqueumasequenciadedirecionamentoeoresultadodeumprimeiroprocessodecodica caorealizadoporumcodigoespeccoequeoconte udodeinforma caoacrescentadonestasequenciaeodirecionamentoparaamitocondria. Estaprimeiracodica caoecombi-nadacomumasegundacodica caorealizadaporoutrocodigoespecco. Estecodigotemcomo objetivo codicar a protena acrescentandoa informa cao sobre a fun cao que a protenadevera executar no interior da mitocondria. Este processo caracteriza o caso mais simples decodigosconcatenadosconhecidoscomocodigosconcatenadosjustapostos.O objetivo do presente trabalho alem de propor um modelo consistente de um sistema decomunica cao digital para o mecanismo de transporte de protenas mitocondriais, consiste emidenticaraexistenciadecodigoscorretoresdeerrosnassequenciasdedirecionamentodasprotenasprecursorasmitocondriais. Umavezalcan cadaessaidentica cao, doiscaminhossao possveis: O primeiro, relacionado `a existencia de regioes nao-codantes fortemente preser-vadasduranteoprocessoevolucionarioentreespecies, erealizarpesquisasnestadire cao, oque possibilitara realizar analises logeneticas e conduzira a um melhor entendimento do pro-cessoassociado`ateoriadaevolu cao. Osegundo,comrela cao`aexistenciadesequenciasnasregioes codantes, o objetivo e identica-las como sendo palavras-codigo de um codigo corretordeerros, possibilitandodessaforma,vislumbrarmetodologiasquepossamserutilizadasemanalisesmutacionaisedepolimorsmos.Comoobjetivodemostraraoleitorograudesostica caoecomplexidadequeenvolveomecanismodeimporta caomitocondrial easuaimportancianocontextobiologicofaremos,aseguir,umabreveexposi caodoassunto.Umdosgrandesdesaosdacienciaecompreenderosmecanismosmolecularesqueocor-remdentrodascelulas. Otransportedeprotenasorganelaresefundamental paramanterascelulassaudaveis, portantoestudossobreosmecanismosquegovernamadistribui caoetransportedeprotenasnascelulaspodemcontribuirparaseobterumacompreensaomaisapurada desta complexa maquinaria, e como seu inadequado funcionamento poderia deagrarumadoen ca.As mitocondrias sao estruturas localizadas no interior das celulas responsaveis pela produ- caodeenergia, atravesdadegrada caodealimentosqueingerimos(carboidratos, protenasegorduras)eoconsumosimultaneodeoxigenio(respira caoaerobica),processodenominadofosforila caooxidativa. Alemdaprodu caoenergeticaedeoxigenioreativo, descobertasre-centesrelatamopapeldamitocondriaemvariosoutrosprocessoscelulares.AmitocondriacontemoseuproprioDNAetodamaquinarianecessariaparaasntese9Captulo1. Introdu caoproteica, apesardesintetizarsomenteumpequenon umerodeprotenas. Agrandemaio-riadasprotenasmitocondriaissaocodicadasporgenesnuclearesesaosintetizadascomopreprotenasemribossomoscitosolicos.Uma vez que existe essa dependencia da sntese proteica realizada no citosol, o transporteadequadodestasprotenasparaosdiversoscompartimentosdamitocondriaefundamentalparaoseufuncionamento e prolifera cao. Agrande maioriadas protenas mitocondriaissintetizadas porgenesnucleareseimportadapos-traducionalmente, demodoqueelassaoliberadas diretamente no citosol e encaminhadas com o auxliode protenas chaperonas paraosreceptoreslocalizadosnamembranaexternadaorganela.Aespecicidadedessemecanismodeimporta caoeestabelecidaporsequenciasdedire-cionamentopresentesprincipalmentenaposi caoN-terminal dasprotenas. Atransloca caodaprotenaatravesdasmembranasbiologicasdamitocondriadependedecomplexosrecep-tores/translocadoresenessetransporteasprotenasdevemestartotalmentedesdobradas.Muitas patologias, e em alguns casos doen cas graves como o cancer, podem residir no ina-dequadofuncionamentomitocondrial. Alemdisso, algumasdoen casauto-imunesdecorremderespostasimunologicasdopacientecomprodu caodeanticorposcontraprotenasmito-condriais. Acreditamosqueo estudosobreestemecanismoalem deinovar ao empregarumamodelagemquefazusodasteoriasdacomunica caoedacodica cao, possacontribuirparaumamelhorcompreensaodocomportamentodosistemadeimporta caodeprotenas.Deacordocomestaproposta, naturalmentesurgemalgumas perguntas: 1) Dentreosdiversoscodigosusadosparaatransmissaodainforma c ao, existealgumcodigocorretordeerroscapazdereproduzirsequenciasdeDNA(sequenciasdedirecionamento)esuascorres-pondentes tas complementares? 2) Seexiste, que codigoeeste equal seraaestruturamatematicaadequadaparaconstruir este codigo? Este trabalhoencaminha, de maneirapositiva,umarespostaaestasperguntas.1.4 Descri caodoTrabalhoEstetrabalhoestaorganizadodaseguinteforma.NoCaptulo2apresentamos,deformasucinta,omecanismodeimporta caodeprotenasmitocondrias ecomentamos sobrealguns tipos demuta coes. Alemdisso, descrevemos osprincipaisconceitosrelacionados`acodigoscorretoresdeerrose`adecodica caodecodigoscorretoresdeerrosqueforamutilizadosnodecorrerdestetrabalho.NoCaptulo3apresentamos as analogias entre umsistemade comuni caodigital e osistemadeinforma caogenetica. Propomos ummodelodesistemas decomunica caoparaomecanismodeimporta caodeprotenasorganelareseestabelecemosocodigocorretorde10Captulo1. Introdu caoerros e a estrutura matematica que reproduzem as sequencias de direcionamento. Utilizamosomodelopropostoparaimporta caodeprotenasorganelarescomoobjetivodedescreveromecanismodecodica caoedecodica caodotransportedeprotenasmitocondriais.NoCaptulo4desenvolvemos umalgoritmoparaareprodu c aodassequenciasdedire-cionamentoatravesdoscodigoscorretoresdeerrosZ4-linear, Z2 Z2-lineareKlein-linear.Asinterpreta coesdosresultadosforam realizadassobopontodevistadecodigoscorretoresde erros, possibilitandoassim, umanovaabordageme umaclassica caomatematicadassequenciasreproduzidas. Atravesdosresultadosobtidoscomoprocessodecodica cao, noCaptulo5descrevemosoprocessodedecodica caodestassequencias. Oprocessodedeco-dica caopodeservistocomoumprocessoderegenera caodasequenciaquereparaoserrosintroduzidosduranteosprocessosdereplica caoetranscri cao.Comanecessidade daredu caode tempoe custos nos experimentos laboratoriais, noCaptulo 6 mostramos algumas aplica coes do modelo proposto para as analises mutacionais/po-limorsmoseanalisesdehipoteseslogeneticas. Estanovaabordagemqueutilizacodigoscorretoresdeerros, emumcontextobiologico, mostra-sebastantepromissora. Finalmente,noCaptulo7apresentamosasconclusoeseaspropostasparatrabalhosfuturos.11Captulo2ElementosdeBiologiaeCodigosCorretoresdeErrosDevidoaocaraterinterdisciplinar destetrabalho, oobjetivoprincipal destecaptuloeapresentar,deformasucinta, arevisaodealgunsconceitossobreaimporta caodeprotenasorganelares,codigoscorretoresdeerroseoprocessodedecodica caodoscodigoscorretoresdeerros.Opresentecaptuloestaorganizadodaseguintemaneira: ASe cao2.1apresentaumarevisaodomecanismodeimporta caodeprotenasmitocondriaiscomoobjetivodemostraraoleitorograudesostica caoecomplexidadequeenvolvetodoesseprocesso. Alemdisso,descrevemosalgunstipos demuta coesqueseraoutilizadasnasinterpreta coesdosresultadosdestetrabalho. NasSe coes2.2e2.3apresentamososconceitossobreacodica caoedeco-dica caode codigos corretoresde erros, respectivamente. Estesconceitosseraoutilizadosnodesenvolvimentodestetrabalho.2.1 Importa caodeProtenasOrganelaresAscelulaseucarioticascontemmembranasintracelularesqueocupamquasemetadedovolume total celular emcompartimentos intracelulares separados denominados organelas.Osprincipaistiposdeorganelasenvoltaspormembranaspresentesemtodasascelulaseu-carioticassaooretculoendoplasmatico, oaparatodeGolgi, on ucleo, asmitocondrias, oslisossomos, os endossomos e os perissomos; as celulas vegetais tambem contem plastdeos, taiscomo cloroplastos. Cada organela contem um conjunto distinto de protenas responsaveis pelamedia caodesuasfun coesexclusivas[5].Cadaprotenaorganelar recem-sintetizadadeve encontrar seucaminhoapartir deri-bossomoslivresouassociados`amembranadoretculoendoplasmatico, ondeesintetizada,13Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosateaorganelaondeexercerasuafun cao. Aprotenasegueumarotaespecca, guiadaporsinaisnasuasequenciadeaminoacidos, quefuncionamcomosequencias sinalizadoras, ouregioessinalizadoras. Assequenciaseasregioessinalizadorassaoreconhecidasporrecep-tores de endere camento complementares que entregam a protena `a organela-alvo apropriada.Asprotenascomfun caocitosolicanaocontemsinaisdeendere camentoepermanecemnocitosolaposseremsintetizadas[5].O encaminhamento de protenas recem-sintetizadas para o seu destino celular apropriado,normalmentechamadodedirecionamentodeprotenasoudistribuicaodeprotenas,compreendedois tipos de processos muito diferentes. O primeiro processo geral envolveo di-recionamento de uma protena para a membrana de uma organela intracelular e pode ocorrerduranteoulogoaposasntesedaprotena, pelatradu c aonoribossomo. Odirecionamentolevaasprotenasdemembranaaseinseriremnabicamadalipdicadamembrana, mas, nocaso das protenas sol uveis em agua, o direcionamento leva `a transloca cao da protena inteiraatravesda membranapara ointerior aquosoda organela. As protenas sao distribudasparaoretculoendoplasmatico(RE),asmitocondrias,oscloroplastos,osperixissomoseon ucleoporesseprocessogeral[6].Umsegundoprocessodedistribui caogeral seaplica`asprotenasqueinicialmentesaodirecionadas paraamembrana doREentrando, desse modo, navia secretora. Essasprotenas incluem nao apenas as protenas sol uveis e as de membrana que residem no proprioRE, mas tambemasprotenasquesaosecretadas apartir dacelula, asenzimas eoutrasprotenas que residem no l umen do complexo de Golgi e dos lisossomos, bem como as protenasintegradasnamembranadessasorganelasedamembranaplasmatica. OencaminhamentoparaoRE, geralmente, envolveprotenasnascentesqueaindaestaonoprocessodesntese[6].Apresente se caoestadivididadaseguinte maneira: NaSubse cao2.1.1apresentamosumaideiageral dealguns conceitos biologicos que seraousados nodecorrer dotrabalho,informamos que esta se caoe parte integrante de [18]. ASubse cao 2.1.2apresenta commaioresdetalhesomecanismodeimporta caodeprotenasparaasmitocondrias,abordandode forma resumida, os complexos de transloca cao envolvidos no transporte das protenas paraasdiferentesregioesdamitocondria. ASubse cao2.1.3forneceumaideiageral sobretiposdemuta coes. Essesconceitosseraousadosnainterpreta caodealgunsresultados.2.1.1 AMoleculadeDNAODNAeumacidodesoxirribonucleico, istoe, umpolmerodedesoxinucleotdeoscujasequenciadebasecodicaainforma caogeneticaemtodasascelulasvivas.Os aspectos estruturais especcos do DNA variam, dependendo da origem e da fun cao de14Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErroscada molecula de DNA. As moleculas de DNA diferem em tamanho, conforma cao e topologia.Apesar de algumas formas de DNAcelulares existiremcomoestruturas de ta unica, aestruturadeDNAmaisdifundidaeaduplahelice.Aelucida caodaestruturadoDNAporJamesWatsoneFrancisCrickem1953e, emgeral,aceitacomoomarcodosurgimentodabiologiamolecularmoderna. AestruturadoDNA de Watson-Crick nao apenas forneceu um modelo da molecula fundamental da vida,comotambemsugeriuomecanismomoleculardahereditariedade. OsachadosdeWatsoneCrick,listadoscomoumadasprincipaisdescobertasintelectuaisdaciencia,foram baseados,emparte, emduasevidenciasalemdaregradeCharga: asformastautomericascorretasdasbaseseasindica coesdequeoDNAseriaumamoleculahelicoidal.As basesp uricas e pirimdicasdos acidos nucleicospodem assumirdiferentesformas tau-tomericas (tautomeros sao isomeros de conversao facil, diferindo entre si apenas nas posi coesdohidrogenio,Figura2.1).Figura2.1: Formastautomericasdasbases.Asinforma coesestruturaislimitadas, juntamentecomaregradeCharga, forneceramalgumaideiadaestruturadoDNA. OmodelodeWatsoneCrickfoi elucidadoprincipal-mentepelaimagina caodelesepor estudosdeconstru caodemodelos. Umavezpublicado,omodelo deWatson e Crickfoi rapidamenteaceitodevido`asua simplicidade,associada`a suaobvia relevancia biologica. Investiga coes posteriores conrmaram a precisao geral do modelo,15Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosapesardosdetalhesteremsidomodicados.OmodelodeWatsoneCrickpossuiasseguintescaractersticasprincipais:1. Duascadeiaspolinucleotdicascircundamumeixocomumformandoaduplahelice(Figura2.2).2. AsduastasdeDNAsaoantiparalelas(possuemdire coesopostas), mascadaumaformaumaheliceparaoladodireito.3. Asbasesocupamocentrodahelice, eascadeiasdea c ucar-fosfatoestaodispostasnaperiferia, minimizandoarepulsaoentreosgruposfosfatocarregados. Asuperfciedaduplaheliceformadoissulcosdelarguradesigual: acavidademaioreacavidademenor(Figura2.2).4. Cadabaseestaligadaaumabasedataopostapormeiodepontesdehidrogenio,formandoumpar debaseplanar. AestruturadeWatsoneCrickpodeacomodarapenasdoistiposdeparesdebase. Cadaresduodeadeninadeveformaroparcomumresduodetiminaevice-versa,ecadaresduodeguaninadeveformar parcomumresduo de citosina e vice-versa (Figura 2.3). Essas intera coes por pontes de hidrogenio,umfenomenodenominadocomopareamentodasbasescomplementares, resultanaassocia caoespeccadasduascadeiasdatadupla.Figura 2.2: Estrutura tridimensional doDNA.Figura 2.3: Fitas complementares de DNA.16Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosAestruturadeWatsoneCrickpoderaacomodarqualquersequenciadebasesemumatapolinucleotdicaseataopostapossuirasequenciade basescomplementaresaela. Issoexplica a regra de Charga. Mais importante ainda, sugere que cada ta de DNA pode atuarcomo um molde para a sntesede suata complementare, consequentemente,a informa caohereditariaestacodicadanasequenciadebasesemqualquerta.Amaioriadas moleculas deDNAeextremamente grande, deacordocomsuafun caodeconter todaainforma caogeneticadacelula. Comrarasexce coes, osorganismosmaiscomplexoscontemmaisDNA. Ogenomadeumorganismo, queeseuconte udoespeccode DNA, pode estar distribudo em diversos cromossomos (do grego, chromos, cor + soma,corpo),cadaumcontendoumamoleculadeDNAseparada.Devido o seu comprimento muito longo, as moleculas de DNA s ao descritas em termos don umero de pares de bases (pb) por milhares de pares de bases (quilobases em pares ou kb).ApesardecadamoleculadeDNAserlongaerelativamenterme,elanaoecompletamentergida. AduplahelicedeDNAformaespiraisevoltasquandocompactadadentrodacelula.Alemdisso, dependendodasequenciadenucleotdeos, oDNApodeadotar conforma coeshelicoidais levemente distintas. Por m, napresen cade outros componentes celulares, oDNApodedobrar-seousuasduastaspodemserparcialmentedesenroladas.AduplaheliceexisteemvariasgeometriasdesignadascomoDNAA, DNAB, DNACeDNAZ. Aforma caodessasdiferentesconforma coesdependedacomposi caoembasesdoDNAedascondi coesfsicas. OmodelodescritoporWatsoneCrickpossui aconforma caodoDNAB.2.1.2 Importa caodeProtenasemMitocondriasAmitocondriae umadas mais importantes organelas celulares que estapresente nascelulaseucarioticas. Apresentampequenoscorposnocitoplasma,envoltosporumacamadademembrana, quecaptamoxigenioeconservamaenergiadaoxida caodecompostosali-mentares-taiscomoa c ucares-paraproduziramaiorpartedoATP(adenosinatrifosfato)que fornece energia para as atividades da celula. As mitoc ondrias tem seu proprio genoma (naforma de uma molecula circular), seus proprios ribossomos (que sao diferentes dos ribossomosencontradosnocitosol),eseuproprioRNAtransportador[5].Apresen cadematerial geneticonamitocondriafezemergir teorias sobresuaorigem.Muitosbiologosargumentamqueamitocondriaumdiateriasidoumorganismobacterianofagocitadopor umacelulaeucariota, passandoapartir da aviver emsimbiose comseuhospedeiro. Seja qual for a sua origem, sua fun cao e vital para a celula, sem a qual ha mortecelularemortedapropriamitocondria[5].Cadamitocondria elimitadaporduasmembranasaltamenteespecializadascomfun coes17Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosvitais para a atividade mitocondrial. Juntas, elas denem dois compartimentos mitocondriaisseparados: oespa cointernodamatrizeoespacointermembranas, bemmais estrito(Figura2.4). Se as mitocondrias foremcuidadosamente rompidas e fracionadas emseuscomponentesseparadamente, acomposi caobioqumicadecadaumadasduasmembranasedos espa cos denidos por elas pode ser determinada, cada um contendo a sua propria cole caodeprotenascomfun coesespeccas[5].Figura 2.4: Micrograa eletronica de uma mitocondria. Lodish et al., Molecular Cell Biology,5thEdition.AsprotenascodicadasporDNAmitocondrial saosintetizadasnosribossomosdentrodas organelas edirecionadas aocompartimentocorretoimediatamente apos asntese. Amaioriadas protenas localizadasnas mitocondrias, entretanto, ecodicadapor genes non ucleoeimportadaparadentrodasorganelasdepoisdesuasntesenocitosol[6].Nasmitocondrias, aimporta caodeprotenasrequerenergiaeocorreempontosemqueasmembranasexternaeinternadaorganelaestaoemcontatoproximo. Asmitocondriascontemm ultiplasmembranaseespa coslimitadospormembranas, adistribui caodevariasprotenas paraasualocaliza caocorretafrequentemente requer aa caosequencial deduassequencias dedirecionamentodedoissistemas detransloca caoligados`amembrana: umaparadirecionarasprotenasparadentrodasmitocondriaseoutraparadireciona-lasparadentrodocompartimentooumembranacorretadaorganela[5].Todas as protenas que viajam do citosol para o mesmo destino na mitocondria tem sinaisde direcionamento que compartilham motivos comuns, embora as sequencias-sinal geralmente18Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosnaosejamidenticas, Figura2.8. Dessamaneira, osreceptoresquereconhecemessessinaissaocapazesdeseligaradiversassequenciasdiferentes,poremrelacionadas[6].Asprotenasimportadasparaasmitocondriassaosintetizadassobaformadeprecur-soresconsistindodaprotenamaduraadicionadadeumapre-sequenciaamino-terminal (N-terminal)oucarboxi-terminal(C-terminal), queconfereaespecicidadedeimporta cao. Assequencias N-terminais sao posteriormente removidas apos ou durante a passagem pelo enve-lope mitocondrial. Protenas destinadas `a membrana externa nao apresentam uma sequenciade direcionamento tpica, de forma que a informa cao de direcionamento localiza-se na por caointernadaestruturaprimaria[7].Oendere camentodasprotenas, porem, emaiscomplexodoqueasimplespresen cadesequencias dedirecionamento. Comonocasodamitocondria, eleenvolvevariossubcom-partimentos. Asprotenasdirecionadasparacadaumdessessubcompartimentosrequereminforma coes de direcionamentoespeccas e vias de direcionamentoque envolvemfatorescomunsedistintosacadaetapa.Apesar disso, em[8], umaviadeimporta cao, divididaemquatroetapas podeser es-quematizada:1. Sntesedaprotenaprecursoraassimcomoseureconhecimentoemanuten caodesuaconforma cao adequada para a importa cao atraves da atua cao de chaperonas molecularesnocitoplasma;2. Liga caodoprecursorareceptoresetransportedesseprecursoratravesdamembranaexternadamitocondriapelocomplexoTOM(translocaseof themitochondrial outermembrane);3. Transporte do precursor atraves do espa co intermembrana e envelope nuclear pelo com-plexoTIM(translocaseofthemitochondrialinnermembrane);4. Processamento proteoltico do precursor, assim como a sua distribui cao intra-organelaremontagemparaaaquisi caodaformafuncional.OscanaisdetranslocacaoAmitocondria esta dividida emquatro subcompartimentos: a membrana externa, oespa cointermembanas, amembranainternae amatriz. Cadaumdos subcompartimen-toscontemumconjuntodistintodeprotenas. Aproximadamentemaisde1000protenasmitocondriaissaocodicadaspelogenomanuclear, sintetizadasnocitoplasmaporribosso-mos citosolicos como protenas precursoras, reconhecidas e/ou mantidas em uma forma poucoestruturada(viaa cao daschaperonasmoleculares),e nalmenteimportadas com aajudade19Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosdiferentes complexos de transloca cao presentes na membrana externa e na membrana internadamitocondria[9]. OcomplexoTOMeocomplexoSAM(sortingandassemblymachi-nery) estao situados na membrana externa e os complexos TIM23 e TIM22 estao ancoradosnamembranainterna[10],comoilustraaFigura2.5.Figura2.5: Os translocons de protenas namitocondria. Pfanner et al., AssemblingtheMitochondrial Outer Membrane, Nature Structural &Molecular Biology, Vol. 11, pp.1044-1048, 2004.Amaioriadasprotenasmitocondriaisereconhecidapelostransloconspormeiodeumasequenciadedirecionamentopresentenormalmenteemsuaregiaoamino-terminal chamadade pre-sequenciaou sequenciade direcionamento. A ecienciado processode importa cao deumaprotenaresidenasintera coesqueocorrementreasuapre-sequenciaeosaparatosdetransloca caopresentesnasmembranasdamitocondriaenocitosol[9].OcomplexoTOMOcomplexoTOMestaancoradonamembranaexternae enecessarioparaaimporta caodetodasasprotenasmitocondriaiscodicadasnon ucleo[5].A maquinaria TOM contem receptores de importa cao que reconhecem as protenas precur-soras mitocondriais atraves de suas sequencias de direcionamento e, entao, iniciam o processodetransloca caodessaprotenaparaoseudevidolocal[11].OcomplexoTOM e mais bemestudadoem leveduras. Nesseorganismoele e constitudopor nove subunidades: Tom70, Tom71, Tom40, Tom37, Tom20, Tom22, Tom7, Tom6eTom5(Figura2.6). Essasnovesubunidades formamtressubcomplexos: Tom20-Tom22e20Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosTom70/Tom71-Tom37 que funcionam como receptores para os precursores, e Tom40-Tom22-Tom7-Tom6-Tom5queformaoporogeraldeinser cao(GIPgeneralinsertionpore)[11].Figura 2.6: O complexoTOM. Dekkeretal.,PreproteinTranslocaseoftheOuterMitochon-drial Membrane: MolecularDissectionandAssemblyof theGeneral ImportPoreComplex,MolecularandCellularBiology,Vol. 18,pp. 6515-6524, 1998.As protenas Tom20, Tom22 e Tom70 funcionam como receptores para as protenas precur-soras mitocondriais. Tom20 e Tom22 formam o complexo receptor principal sendo que Tom22interage com precursores contendo sequencias de direcionamento internas ou no amino termi-nal, enquantoqueTom20reconheceespecicamentepre-sequenciasaminoterminais. Alemdisso,Tom22ancora-se namembranaexternadamitocondria e formaumaconexaoentreosdois subcomplexos Tom20-Tom22 e Tom70/Tom71-Tom37 [12]. Tom70 interage com precur-soresquepossuemsequenciasdedirecionamentointernas. Tom37associa-secomTom70, eevidenciasgeneticasindicamqueocorreumaintera caofuncional entreeles, indicandoqueTom37eumasubunidadedoreceptorTom70. Asprotenasprecursorasinicialmentereco-nhecidaspor Tom70saotransferidasparaTom20e/ouTom22antesdesuainser caonoGIP[11].Tom40representaomaiorcomponentedoGIPeefundamentalparaasobrevivenciadamitocondria. AprotenaTom5funcionalmenteligareceptoresdoGIPepromoveainser caodosprecursores. EnquantoTom5interagediretamentecomosprecursores, Tom6eTom7inuenciamna intera cao entre Tom20-Tom22e Tom40 [11]. Oprimeiro favorecendo asintera coes eosegundofavorecendoadissocia caoformandoumequilbriodinamicoqueenecessario`aimporta caodeprotenas[11].21Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosOcomplexoTIM23OcomplexoTIM23eomaiortranslocadordeprecursoresmitocondriaisdamembranainterna. Ele e usado por todas as protenas que sao direcionadas para a matriz e a maioria dasprotenasdamembranainterna. OtranslocadorTIM23necessitadeduasfontesdeenergia:o potencial de membrana e o ATP, para realizar a inser cao do precursor. O complexo TIM23e responsavel pela importa cao de precursores contendo sinal de direcionamento para a matrizmitocondrial[13].OcomplexoTIM23ilustradonaFigura2.7, emleveduras, podeserestruturalmenteefuncionalmentesubdivididoem:1. Canal detranslocacao, queestaintegrado`amembranainternaeecompostapor:Tim17,Tim21,Tim23eTim50;2. Motor de importacao, que esta ancorado na matriz e e composto por: Tim14, Tim16,Tim44,Mge1emtHsp70.Figura2.7: OcomplexoTIM23. Mokranjac, etal., Proteinimport intomitochondriaBio-chemicalSociety,Vol. 33,pp. 1019-1023, 2005.Tim50 e o primeiro componente do complexo TIM23 que interage com a protena precur-soraaposelatercruzadoamembranaexterna[13]. AssubunidadesTim17eTim23estaoinseridasnamembranainternaefuncionamcomoumcanal, enquantoqueTim44interagecomTim23doladodamatriz namembranainternamitocondrial [14]. Juntamentecom mt-Hsp70, Mgel (co-chaperone) e consumo de ATP, o complexo TIM23 promove o transporte doprecursor atraves de varios ciclos liga-desligado precursor com mt-Hsp-70. Esse mecanismopodeserinterpretadopormeiodeummodelochamadomotormolecular[15].22Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosOcomplexoTIM22Ocomplexo TIM22e responsavel pelainser cao de carreadores namembrana internamitocondrial. EmleveduraseconstitudoporTim22, Tim54, Tim18eTim12[16]. Muitasprotenasqueintegramamembranainterna, taiscomoaADP/ATPcarreadores(AAC)eoutros membros da famlia de carreadores mitocondriais, sao sintetizados sem o sinal classicoN-terminal de direcionamento para a matriz. Tais precursores sao importados via o complexoTIM22. Otransporte dafamliade carreadores atraves doespa cointermembranae suatransferencia parao complexo TIM22e mediado por protenas de baixo peso molecularchamadas: Tim8, Tim9, Tim10, Tim12e Tim13. Essa importa c aoe explicada em[17]atravesdevariosestagios:1. Estagio1. OprecursorcitosolicodoAACereconhecidoporreceptoresespecializadosdocomplexoTOM;2. Estagio2. EleetranslocadoparcialmentepelocomplexoTOMeinteragecomocom-plexoTim9-Tim10noespa cointermembranas;3. Estagio3. OprecursoretransferidoparaocomplexoTim9-Tim10-Tim12queestaassociadoaocomplexoTim22, queporsuavez, seencontraancoradonamembranainterna;4. Estagio4. Napresen cadeumpotencial demembrana, , Tim22mediaainser caodoprecursorAACparaointeriordamembranainterna;5. Estagio5. Quandooedissipado, oprecursorAACpassaporumestagiointer-mediario, como no estagio 3, onde ele esta parcialmentetranslocado entre a membranaexternaeinterna. EsseestagioexigeoTim10.Os carreadores sao sintetizadossem uma pre-sequenciae contem sinaliza cao internaparaodirecionamentomitocondrialeimporta cao.OcomplexoSAMEstudos recentes mostramque, alemdocomplexodetransloca caoTOM, asprotenasdamembrana mitocondrial saoinseridas comoauxliode umamaquinaria de sele cao emontagem(SAMsortingassemblymachinery) [7]e[10].OcomplexoSAMeessencial paraaviabilidadedacelula. ProtenasdocomplexoSAMtem sidodescritas. Umadelas e a Sam50uma protenadamembranaexternae representaasubunidade central do complexo SAM, esta protena contem um domnio N-terminal que esta23Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosexpostonoespa cointermembranas. OutrasprotenasidenticadasforamaSam35eaSam37. Porem, a fun caomolecular exata de cada uma dessasprotenas ainda sao desconhecidas,emboraalguns experimentos demonstramqueessas protenas podemcolaborar paraumaintegra caoecientedeprecursoresdemembranaexterna[10].DiferentesrotasparaaimportacaodeprotenasmitocondriaisAs protenas precursoras podemser importadas paraas mitocondrias atraves de seterotasdiferentes(Figura2.8)queestaoclassicadasdaseguinteforma: asprotenasquesaoimportadasparaamembranainternapodemseguir3rotasdiferentes; asprotenasquesedestinamaoespa cointermembranasseguem2rotas;asprotenasimportadasparaamatrizeparaamembranaexternaseguemapenasuma unicarota.Figura2.8: Diferentesrotasparaaimporta caodeprotenasmitocondriais. Lodishet al.,MolecularCellBiology,5thEdition.1. ImportacaodeprotenasparaointeriordamatrizmitocondrialAs protenas importadas paraamatrizdamitocondriasaogeralmente captadas docitosol dentrodesegundosouminutosaposasualibera caopelosribossomosporummecanismopos-traducional, istoe, asprotenasmitocondriaissaoprimeirocompleta-mentesintetizadascomoprotenasprecursorasnocitosol e, entao, translocadaspara24Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosamitocondria[5]. AFigura2.9ilustraaimporta caodeprotenasparaamatrizdamitocondria.Figura2.9: Importa caodeprotenasparaointeriordamatriz. Lodishetal.,MolecularCellBiology, 5thEdition.Asprotenasprecursorassintetizadasnosribossomoscitosolicossaomantidasemumestadonao-dobradoouparcialmentedobradopelaschaperonasligadas, comoaHsc70(etapa1). Depoisqueumaprotenaprecursoraseligaaumreceptordeimporta caoproximoaostiodecontatocomamembranainterna(etapa2),ela etransferidaparadentrodoporoprincipal de importa cao(etapa3). Aprotenasendotransportadaatravessa,entao,essecanaleumcanaladjacentenamembranainterna(etapas4e5).Note que o transporte ocorre em stios de contato raros, onde as membranas internaeexternaparecemsetocar.A liga cao da protena sendo transportada pela chaperona Hsc70 da matriz e a hidrolisede ATPsubsequente pelaHsc70ajudamadirecionar aimporta caoparadentrodamatriz. Umavezqueasequenciadecapta cao-direcionamentosejaremovidaporumaproteasedamatriz eaHsc70sejaliberadadaprotenarecem-importada(etapa6), elase dobra na conforma cao madura e ativa dentro da matriz (etapa 7). O dobramento dealgumasprotenasdependedaschaperoninasdamatriz.2. ImportacaodeprotenasparaamembranaexternamitocondrialOs experimentoscom aporinamitocondrial (P70) forneceraminforma coessobre como25Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosprotenassaodirecionadasparaamembranamitocondrialexterna, Figura2.10. UmasequenciacurtadedirecionamentoparaamatriznaextremidadeN-terminal daP70eseguidapor umlongotrechode aminoacidos hidrofobicos (ver Figura2.8). Se asequenciahidrofobicaeeliminadaexperimentalmentedaP70, aprotenaseacumulanoespa codamatriz, comasuasequenciadedirecionamentoparaamatrizaindali-gada. Essaobserva caosugerequeassequenciashidrofobicaslongasfuncionamcomosequenciasdenaliza caoquetantoimpedematransferenciadaprotenaparadentrodamatriz comoas ancoram comoumaprotenaintegradana membranaexterna. Nor-malmente,a sequenciade direcionamentopara a matriz e a sequenciade naliza cao detransferencia nao sao clivadas da protena ancorada. A fonte de energia para direcionarasprotenasdemembranaexternaatravesdoporogeraldeimporta caoaindanaofoiidenticada.Figura2.10: Importa caode protenas paramembranaexterna. Pfanner, AssemblingtheMitochondrial OuterMembrane,NatureStructural&MolecularBiology,Vol. 11,pp. 1044-1048.3. Importacaodeprotenas paraoespacointermembranicomatrizmitocon-drialDuasviasparatransportar asprotenasdocitosolparaoespa cointermembranamito-condrialestaoilustradasnaFigura2.11.AviaA,aprincipalviadeencaminhamentoparaoespa cointermembranas,esimilar`a via A para encaminhamentopara a membranainterna (ver Figura 2.12). A principaldiferen ca e que a sequenciade direcionamentointerna nas protenas, como o citocromo26Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosFigura 2.11: Importa cao de protenas para o espa co intermembranas. Lodish et al., MolecularCellBiology, 5thEdition.b2destinadoparaoespa cointermembrana, ereconhecidoporumaproteasedamem-branainterna,queclivaaprotenanoladodoespa cointermembranasdamembrana.Aprotenaliberadasedobraeseligaaoseuco-fatorhemedentrodoespa cointer-membranas. AviaBenvolveoencaminhamentodiretoparaoespa cointermembranasatravesdoporogeraldeimporta caoTom40,namembranaexterna.4. ImportacaodeprotenasparaamembranainternamitocondrialTres vias para transportar as protenas do citosol para a membrana mitocondrial internaestaoilustradasnaFigura2.12.Asprotenas comdiferentes sequencias dedirecionamentosaoencaminhadas paraamembranainternaporviasdiferentes. Emtodasastresvias, asprotenascruzamamembranaexternapeloporogeraldeimporta caoTom40. Asprotenasencaminhadaspelas vias A e B contem uma sequencia de direcionamento para a matriz na extremidadeN-terminal queereconhecidapeloreceptordeimporta caoTom20/22, namembranaexterna. EmboraambasasviasutilizemocanaldamembranainternaTim23/17,elasdiferemporqueaprotenaprecursorainteiraentranamatrizee,entao,redirecionadaparaamembranainterna,naviaB.27Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosFigura2.12: Importa caodeprotenasparaamembranainterna. Lodishet al., MolecularCell Biology, 5thEdition.AHsc70damatriztemumpapel similar aoseupapel naimporta caodeprotenassol uveis damatriz(ver Figura2.9). As protenas encaminhadas pelaviaCcontemsequencias internas que sao reconhecidas pelo receptor de importa cao Tom70. Um canaldetransportediferente,namembranainterna(Tim22/45), eutilizadonestavia. Duasprotenas intermembranas (Tim9e Tim10) facilitamatransferenciaentre os canaisexternoeinterno.2.1.3 Muta coesEm biologia, as muta coes sao mudan cas na sequencia dos nucleotdeos do material geneticodeumorganismo. Muta coespodemsercausadasporerrosdecopiadomaterial duranteadivisaocelular,por exposi caoa radia cao ultravioletaou ionizante, mutagenicosqumicos,ouvrus. Afontedamuta caonaoserelacionacomseusefeitos,apesardeseusefeitosestaremrelacionadoscomquaiscelulassaoafetadaspelamuta c ao.Muta coesgeramvaria coesnoconjuntodegenesdapopula cao. Muta coesdesfavoraveis(ou deleterias) podem ter sua frequenciareduzidana popula cao por meio da sele cao natural,enquantomuta coesfavoraveis(benecasouvantajosas)podemseacumular, resultandoemmudan cas evolutivas adaptativas. Por exemplo, umaborboletapodeproduzir umaprolecomnovasmuta coes. Amaioriadessasmuta coesnaoter aefeito. Noentanto, umadelaspodemudaracordosdescendentesdesseindivduo,tornando-osmaisdifceis(oufaceis)deserem vistos por predadores. Se essa mudan ca de cor for vantajosa, a chance dessa borboletasobrevivereproduzirsuapropriaproleseraumpoucomaior, ecomotempoon umerode28Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosborboletascomessamuta caoconstituiraumamaiorpropor caodapopula cao.Muta coesneutrassaodenidascomomuta coescujosefeitosnaoinuenciamaaptidaodosindivduos. Acredita-sequeaimensamaioriadasmuta coesnaotemefeitosignicativonaaptidaodos organismos. Alemdisso, mecanismos de reparode DNAsaocapazes decorrigir amaior parte das mudan cas antes que elas se tornemmuta coes permanentes, emuitosorganismostemmecanismosparaeliminarcelulassomaticasquesofrerammuta coes.Asmuta coes saoconsideradas omecanismoquepermiteaa caodasele caonatural, jaqueinsereavaria caogeneticasobreaqual elairaagir, fornecendoasnovascaractersticasvantajosasquesobrevivemesemultiplicamnasgera coessubsequentesouascaractersticasdeleteriasquedesaparecememorganismosmaisfracos.A sequenciade um gene pode ser alterada de diversasmaneiras. Muta coes geneticastemdiferentesefeitosnasa ude,dependendodeondeocorremesealteramafun caodeprotenasessenciais. Asmuta coessaoclassicadasdevariasformas, comoporexemploporefeitonaestrutura,nafun cao,etc. Seguealgunsexemplosdemuta coes:1. Muta coes de pequenaescala, comoaquelas que afetamumgene emumoupoucosnucleotdeos,incluindo:Mutacaodeponto: geralmentecausadaporsubstanciasmutagenicasouerrosna replica caodo DNA, ha a troca de um unico nucleotdeo por outro [19]. A maiscomum, conhecidaportransi cao, ocorrequandohaatrocadeumapurinaporoutrapurina(AG)ouumapirimidinaporoutrapirimidina(CT). Umtipo de muta cao de ponto menos comum e a transversao, em que ha a troca de umapurinapor umapirimidina, ou vice-versa(C/TA/G). Umamuta caode pontopode ser revertida por outra muta cao de ponto em que o nucleotdeo e mudado devolta ao seu estado original (reversaoverdadeira) ou por uma reversaoa partir deoutra muta cao (uma muta cao complementar em outro local que resulta no retornodogene`afun caoanterior)[20]. Muta coesdepontoqueocorrem dentrodaregiaocodicadora da protena podem ser classicadas em tres tipos, dependendo do tipodeexpressaoapresentadopelocodonmutado[6]:a) Muta caosilenciosa: naocausamudan canasequenciadeaminoacidosounaatividadedaprotenacodicadapelogene.b) Muta caodesentidotrocado: consistenasubstitui caodeumaminoacidoporoutro resultandoemconsequenciasfenotpicasobservaveisdevidoa mudan canaatividadedaprotena;c) Muta caosemsentido: eaintrodu caodeumcodondeparadaprematuroqueinterrompeaprotenaantesdeseutermino.29Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosInsercao: ocorrepelaadi caodeumoumaisnucleotdeosnasequenciadeDNA.Geralmente, essetipodemuta caoecausadoportransposonsouerrosduranteareplica caodeelementosrepetitivos(sequencias AT, porexemplo). Insersoesnaregiaocodicadoradeumgenepodemalterar ocorte(splicing) domRNA, oucausarmudan canoquadrodeleituradoscodons.Delecao: Haaremo caodeumoumaisnucleotdeosdasequenciadeDNA. As-simcomoinsersoes,essasmuta coespodemmodicar o quadrodeleituradogene.Geralmente elas sao irreversveis; apesar de teoricamente a mesma sequencia poderserrestauradaporinser cao, elementosdetransposi caocapazesdereverterumadele caomuitocurta(comumaouduasbases)emumdadolocal saomuitoim-provaveisoumesmoinexistentes.Eimportantenotarqueumadele caonaoeooposto exatode uma inser cao. Enquantodele coessao aleatorias, inser coesconsis-temdeumasequenciaespeccasendoinseridaemlocaisquenaosaocompleta-mentealeatorios.As mutacoes malecas sao mudan cas no DNA causadas por muta coes que podem causarerros na sequencia das protenas, criando protenas parcial ou completamente nao-funcionais.Parafuncionarcorretamente, cadaceluladependedemilharesdeprotenasparafuncionarnosstioscertos. Quandoumamuta caoalteraumaprotenaquetemumpapel importantenocorpo, poderesultarnumadoen ca. Umaenfermidadecausadapormuta coesemumoumais genes e chamadode doen cagenetica. Contudo, apenas umapequenapercentagemdemuta coescausadoen casgeneticas; amaiorianaotemimpactonasa ude. Porexemplo,algumas muta coes alteram a sequencia de bases de DNA de um gene mas nao mudam a fun caodaprotenaproduzidaporessegene. EstudosnamoscadafrutaDrosophilamelanogastersugeremqueseumamuta caomudadefatoumaprotena,estamudan caseraprovavelmentemaleca, com70por centodestas muta coes tendoefeitos negativos e sendoas restantesneutrasoufracamentebenecas[21].Seumamuta caoestiverpresentenumacelulagerminal,podedarorigemadescendentesportadores dessa muta cao em todas as suas celulas. Este e o caso de doen cas hereditarias. Poroutrolado, umamuta caopodeocorrernumacelulasomaticadeumorganismo. Algumasmuta coes podemestarpresentes emtodososdescendentes destacelulaecertasmuta coespodemprovocarqueacelulasetornemaligna,econsequentementecausecancer[22].Muitas vezes, muta coes genicas que poderiam provocar uma doen ca genetica sao reparadaspelo sistema celular de repara cao do DNA. Cada celula temumcerto n umero de viasbioqumicasatravesdoqual enzimasreconhecemereparamerrosnoDNA. ComooDNApode ser danicado ou mutado de diversas maneiras, o processo de repara cao do DNA e uma30Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosmaneiraimportantedocorposeprotegerdedoen cas.Asmutacoesbenecassaomuta coesquelevam`anovasversoesdeprotenasqueaju-damoorganismoefuturasgera coesaadaptar-semelhoramudan casnoseuambiente. Porexemplo, uma dele cao especcade 32 pares de base no CCR5 humano confere resistenciaaoHIV ahomozigoticose atrasao despoletardoSIDA emheterozigoticos. A muta caoCCR5 emaiscomumempessoascomascendenciaeuropeia. UmateoriaparaaetiologiadarelativaaltafrequenciadoCCR5-32napopula caoeuropeiaequeestaconfereresistencia`apestebubonica que agelou a Europa em meados do Seculo XIV. Pessoas que tinham esta muta caoforamcapazesdesobreviver`ainfec cao, porestemotivoasuafrequencianapopula caoau-mentou[23].2.2 CodigosCorretoresdeErrosAteoriadecodigoseumramodamatematicaemfrancaatividadepossuindovariasra-mica coes que utilizam ferramentas bastante diversas, como por exemplo, teoria dos n umeros,teoriados grupos, combinatoria, geometrias nitas e geometriaalgebrica, dentre outras.Codigos sao utilizados sempre que se deseja transmitir ou armazenar dados. Por exemplo, nascomunica coes via satelite, nas comunica coesinternas de um computador, no armazenamentodedadosemCDeDVDouarmazenamentoopticodedados.O objetivo de um sistema de comunica cao e transmitir informa cao de uma fonte para umdestinatarioatravesdeumcanaldecomunica caocomamaiorconabilidadepossvel.AteoriadecodigosfoifundadapelomatematicoClaudeE. Shannon[24], nadecadade40. Ateoriadecodigoscorretoresdeerrosteveincionestamesmadecadacomos trabalhosdeGolay[25], Hamming[26]eShannon[24]. Agrandedescobertadaepocasurgiu, princi-palmentedevidoaShannon,comosmodelosdecodigoscapazesdedetectarecorrigirerrosnum sistema de comunica coes. Shannon provou que para taxas de transmissao de informa caomenores do que a capacidade de canal, sempre existe um codigo que permite uma transmissaocomprobabilidadedeerroarbitrariamentepequena.Assim, as pesquisas se direcionaram para a procura de bons codigos e bons conjuntosde sinais associados a esses codigos, bem como, projetar decodicadores ecientes para essescodigos.Nalinhadecodigossurgiramasclassesdecodigoslinearesenao-linearesenalinhadeconjuntos de sinais forampropostos constela coes desinais otimas sobdiversas restri coes,como por exemplo, potencia media, potencia de pico, faixa e algumas combina coes destas, oscodigosdeSlepian, seusvariantesobtidosatravesdegruposdetransforma coesortogonais,asconstela coestendocomobasereticulados,etc.31Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosEssaslinhasdepesquisasempreforamtratadasseparadamenteate1982, quandoUnger-boeck [27] mostrou que, atraves do conceito de particionamento de conjunto de sinais, ganhosdecodica caosignicativoseramobtidos. Surgindoassim,amodula caocodicada.Dentrodessanovalinhadepesquisa, Forney[28]apresentouumanovaclassedecodigosdenominada codigos geometricamente uniformes que, alem de englobar os codigos de Slepianeoscodigosreticulados,estendeoprocedimentopropostoporUngerboeck.Aprocuradebonscodigoscontinuasendorelevante,poremtendoquesatisfazer,semprequandopossvel,apropriedadedeseremgeometricamenteuniformes.Os codigos lineares constituemumaclasse importante de c odigos por possuremumaestrutura algebrica permitindo que principalmente a decodica cao seja bastante simplicada.Emcontrapartida, acapacidadedecorre caodeerrosdestes codigosnaoemelhor doqueaqueladecertoscodigosnao-lineares.Por outrolado,os codigosnao-linearesnaopossuemumaestruturaalgebricacomoadoslineares. Estaexibilidade possibilitaobter codigos comdistancias deHammingmaioresdoqueasencontradascomoscodigoslineares. Porem, afaltadeumaestruturaalgebricaaumentaacomplexidadedoprocessodedecodica cao.Oobjetivoe apresentar alguns dos principais conceitos de algebrae codigos que saofundamentaisparaacompreensaodopresentetrabalho. NaSubse cao2.2.1apresentamosasprincipaisdeni coesepropriedadesdasestruturasdegrupo,anelecorpo. Estasestruturassaofundamentais nateoriade codigos corretores de erro, pois facilitamos processos decodica cao, decodica caoeanalisededesempenhodestes. NaSubse cao2.2.3revemos osconceitosrelacionadosacodigosdeblocoesuasprincipaiscaractersticas. ASubse cao2.2.4apresentaumabreveintrodu caoaoscodigosgeometricamenteuniformes, aosconjuntosdesinais casados a grupos e aos codigos G-lineares. Estes conceitos foram usados com o objetivodepropor um sistemade comunica caopara aimporta cao de protenas organelares,Captulo3.2. Nas Se coes 2.2.5 e 2.2.6 abordamos os principais conceitos sobre codigos BCH utilizadosnodecorrerdopresentetrabalho.2.2.1 EstruturasAlgebricasOsconceitosapresentadosnestasubse caopodemserencontradosem[29]e[30].GruposDenicao2.2.1. Umaopera c aobin ariasobreumconjuntoSeumaregraqueassociaalgum elemento de S a cada par ordenado (a, b) de elementos de S. (a b denotara o elementoassociadoa(a,b)atravesde.32Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosEssanecessidadede que o elementoestejatambem em Se conhecidacomo condicaodefechamento. Assim, exigimosqueSsejafechadosobumaopera caobinariaemS. Notequeapenasum unicoelementoeassociadoacadaparordenadodeS.Denicao2.2.2. UmgrupoG, )eumconjuntonaovazioGcomumaopera caobinariasobreG,tal queosseguintesaxiomassaosatisfeitos:1. Aopera caobinariaeassociativa;2. HaumelementoeemGtalquee x = x e = xparatodox G. (Esseelementoe eoelementoidentidadeparasobreG);3. ParacadaaemG, existeumelementoa1emGcomapropriedadequea1 a=aa1= e. (O elemento a1e oelementoinversode acomrela c ao` aopera c ao).ComoconsequenciadaDeni cao2.2.2temososseguintesresultados:1. OelementoidentidadedeumgrupoG e unico.2. OinversodecadaelementopertencenteaumgrupoG e unico.Denicao2.2.3. UmgrupoGeabeliano(oucomutativo)sesuaopera caobinariaforcomutativa.Exemplo2.2.1. OconjuntoZsobaopera cao+eumgrupo. Notequetodasascondi coesdadeni caodeumgruposaosatisfeitas. Estegrupoeabeliano.UmaclassedegruposbastanteusadaemcodigoscorretoresdeerroeadosgruposZn,ouseja,osinteirossobadi caomodulon.Denicao2.2.4. Sejanuminteiropositivoesejamhekinteirosquaisquer. Orestorquandoh + kedivididoporn, segundooalgoritmodadivisaodeEuclides,easomadehekm odulon. Assim,temosqueZn= 0, 1, 2,, n 1.Analogamente, podemos denir produtode s et moduloncomosendoorestodadivisaode(st)porn.Teorema2.2.1. OconjuntoZneumgruposobaopera caoadi caomodulon.Denicao 2.2.5.Se G e um grupo nito, entao a ordem de G, [G[, e o n umero de elementosdeG.33Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosDenicao 2.2.6.Se um subconjunto H de um grupo G e fechado sob a opera cao binaria sobreGeseHeumgruposobestaopera caobinaria,entaoHeumsubgrupodeG.EscrevemosH G.Denicao2.2.7.Seja H um subgrupo de um grupo G. Diz-se que H enormal em G, ou H eumsubgruponormal de um grupo G, se qualquer uma das seguintes condi coes equivalentesocorrer:1. gH= Hgparatodog G;2. g1Hg = Hparatodog G;3. g1Hg Hparatodog G;4. g1hg Hparatodog Geh H.Exemplo2.2.2. Todosossubgruposdegruposabelianossaonormais.Teorema2.2.2. SejaGumgrupoesejaa G. EntaoH= an[ n Z,e um subgrupo de G e e o menor subgrupo de G que contem a, ou seja, qualquer outro subgrupoquecontemacontemtambemH.Denicao2.2.8. OgrupoHdoTeorema2.2.2 eosubgrupocclicodeGgeradopora,eodenotamospora).Denicao2.2.9. DadosumgrupoGeumelementoa G,seocorrerqueG = an[ n Z,entaoaeumgeradordeGeogrupoG = a)ecclico.Exemplo2.2.3. OgrupoZsobadi caoeumgrupocclicocujosgeradoressao1e1.Denicao 2.2.10.Uma rela cao sobre um conjunto S que satisfaz as seguintes propriedadesparatodoa, b, c S,1. a a;2. Sea b,entaob a;3. Sea beb c,entaoa c,34Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErroseumarela c aodeequivalenciasobreS.Cadacelulaadaparti caodadaporumarela caodeequivalencia eumaclassedeequivalencia.Denicao2.2.11. SejaHumsubgrupodeumgrupoG.OsubconjuntodeGaH= ah [ h H,eaclasselateral ` aesquerdadeHcontendoa. Analogamente,Ha = ha [ h H,eaclasselateral ` adireitadeHcontendoa.Teorema 2.2.3 (Teorema de Lagrange).Seja H um subgrupo de um grupo nito G. EntaoaordemdeHeumdivisordaordemdeG,ouseja,[H[(n umerodeclasseslateraisdeGcomrela caoaH) = [G[.Corolario2.2.1. Todogrupocujaordemeumn umeroprimoecclico.Teorema2.2.4. A ordemdequalquer elemento deumgruponitodivide aordem dogrupo.Teorema 2.2.5. SejaHumsubgrupode umgrupoG. Entaoamultiplica caode classeslaterais`aesquerdaedenidacomo(aH)(bH) = (ab)H,se,esomentese,HenormalemG.Denicao2.2.12. SejaHumsubgruponormaldeG.Entao,oconjuntodasclasseslateraisdeHformamumgrupo,denotadoporG/H,sobaopera caobinaria(aH)(bH) =(ab)H. OgrupoG/HechamadogrupoquocientedeGmoduloH.Exemplo2.2.4. ComoZeumgrupoabeliano, nZeumsubgruponormal. Logo, temosogrupoquocienteZ/nZ = Zn.Denicao 2.2.13.A ordem n de um elemento a pertencente a um grupo G e o menor inteiropositivotal quean= e,ondeeeaidentidadedogrupo.Denicao2.2.14. Consideredoisgrupos quaisquerGeG

eafun cao(oumapeamento) : G G

. DizemosqueeumhomomorsmodeGemG

se(ab) = (a)(b)35Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosparatodoa, bG. (NotequeoprodutoabocorreemG, enquantoqueoproduto(a)(b)ocorreemG

).Denicao 2.2.15. Umisomorsmode GemG

e umhomomorsmoonde a fun cao : G G

ebijetora. DizemosqueGeG

saoisomorfoseescrevemosG= G

.2.2.2 AneisDenicao 2.2.16. Umanel R, +, ) e umconjuntonaovazioRjuntamente comduasopera coes binarias +edenidas sobreR,as quaischamamos deadi cao emultiplica cao, talqueosseguintesaxiomassaosatisfeitos:1. R, +)eumgrupoabeliano;2. Aopera caodemultiplica caoeassociativa,istoe,(ab)c = a(bc),a, b, c R;3. Paratodoa, b, c R,evalidaaleidistributiva`aesquerda,a(b + c) = (ab) + (ac),e`aleidistributiva`adireita,(a +b)c = (ac) + (bc).`AsvezesdizemosapenasReumaneloufalamosdoanel R, porsimplica caodelinguagem. Istopressupoe, naturalmente, umpardeopera coesemRcomaspropriedadescitadas.Exemplo2.2.5. Saoexemplosdeaneis: Z, +, ),Q, +, ),R, +, ),C, +, )eoconjuntodospolinomiosdaformaa0 + a1x + a2x2++ anxnnavariavel xecoecientesinteiros,comasopera coesdeadi caoemultiplica caodepolinomios.Exemplo2.2.6. Oconjunto0, 1, . . . , n 1formaumanel sobasopera coesdesomaeprodutomodulon.Denicao 2.2.17.Dizemos que Q e umsubanel de um anel R se Q R e Q tambem formaumanel sobasopera coes+e,herdadasdeR.Denicao 2.2.18. SejamRe R aneis. Umafun cao(mapeamento) : RR

e umhomomorsmoseascondi coesabaixosaosatisfeitas,paraa, b R:1. (a +b) = (a) + (b);2. (ab) = (a)(b).Denicao2.2.19. UmisomorsmodeReR

eumhomomorsmo: RR

bijetor.DizemosentaoqueReR

saoisomorfos.36Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosDenicao 2.2.20.Um anel R em que a multiplica cao e comutativa, isto e, ab = ba para todoa, bR,echamadoumanel comutativo. Sealemdisso, Rpossuirelementoidentidadeem rela cao `a multiplica cao, quesera denotado por 1,dizemos queR e umanel comutativocomunidade.Teorema2.2.6. SeReumanel comunidade, entaoestaunidade1ea unicaidentidademultiplicativadoanel.Denicao2.2.21. Umsubanel Qdeumanel Reumideal ` adireita(ou` aesquerda)emRseQb Q (bQ Q)paratodob R. SeQesimultaneamenteumideal`adireitae`aesquerdaemR,dizemosqueQeumidealemR.Sejam Rum anel, Qum ideal em Re x um elementoem R. Assim, Qdene uma rela caodeequivalenciaemR,dadapor:x x

x x

Q.Estasclassesdeequivalenciasaoosconjuntos:x = x + Q = x +q [ q Qe sao chamadas classeslateraisaditivas de Qem R. Todo elementoem Resta contido emexatamenteumaclasselateral x. DenotamosoconjuntodetodasessasclasseslateraisporR/Q. Apartirdasopera coesdeadi caoemultiplica caoemR,denimosduasopera coesemR/Qdaseguinteforma:x +y= (x + Q) + (y + Q) = x +y = (x +y) + Qexy= (x + Q)(y + Q) = xy= xy + Q.Estasopera coessao, respectivamente, aadi caoeamultiplica caoemR/Q.Epossvelmostrar que R/Qe um anel sob as opera coes acima, chamado anel quociente de R moduloQedenotadoporRQ.Exemplo2.2.7. OconjuntoZn,n 2,podeser vistocomoumanel quocientedeZmodulonZ, ouseja, Z/nZ, poisnZeumideal emZ. Assim, (0, 1,, n 1)denotamasclasseslaterais:0 = nZ, 1 = 1 +nZ, , n 1 = n 1 +nZ37Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosque possuem estrutura de anel sob adi cao e multiplica cao de classes laterais e que particionamZ.Denicao2.2.22.Se a e b sao elementos nao nulos de um anel R tais que ab = 0 ou ba = 0,entaoaebsaodivisoresdezero.Exemplo2.2.8. EmZ8oselementos2e4saodivisoresdezero.Denicao2.2.23. SejaRumanel comunidade. UmelementoaemReumaunidadeinversvelemRseexisteumelementoa1 Rtal queaa1= a1 a = 1. Ouseja,aeinversvelsepossuiinversomultiplicativoemR.Exemplo2.2.9. Os unicoselementosinversveisemZsao1ou1.Denicao2.2.24. Anel de divis aoeumanel comunidadenoqual todoelementonaonuloeinversvel.Denicao2.2.25. SejaRumanel. UmR-m odulo consiste deumgrupoabeliano Ge umaopera caodemultiplica caodecadaelementodeGportodoelementodeRpelaesquerda,taisqueparatodo, Ger, s R,asseguintescondi coessaosatisfeitas:1. (r) G;2. r( +) = r +r;3. (r +s) = r +s;4. (rs) = r(s).CorposDenicao2.2.26. UmcorpoFeumaneldedivisaocomutativo.Portanto, dizemosqueFeumcorposobasopera coesbinarias(+)e()se, esomentese, Fconstitui umgrupoabelianosobestasopera coese, paraaopera cao(),evalidaaleidistributiva. Assim, podemosdizerqueumcorpoapresentanomnimodoiselementos: asidentidades das opera coes (+) e (). O n umero de elementos num corpo e a ordem do mesmoeumcorpoondeesten umero enito echamadocorponito.Exemplo2.2.10.Sao exemplos de corpos: o conjunto dos n umeros racionais e dos n umerosreaissobadi caoemultiplica caousuaiseoconjuntoZp=0, 1, 2,, p 1parapprimosobadi caoemultiplica caomodulop.38Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosExemplo2.2.11. Oconjuntodosn umerosinteirosnaoformaumcorposobasopera coesdeadi caodemultiplica caousuais.Denicao2.2.27. Umsubcorpo eumsubconjuntodeumcorpoquetemestruturade corposobasopera coesherdadasdomesmo.Oscorposnitos saousados namaioriadas constru coes doscodigos conhecidos, estescorpos sao tambem conhecidos como corposalgebricosdeGalois ou corposdeGalois esao denotados por GF(q) ou Fqonde q 2 e o n umero de elementosdo corpo. DescrevemosaseguirumaseriedepropriedadessobreFq.Denicao2.2.28. Umpolin omiodegraun 1sobreumcorpoFqeescritocomo:p(x) = pn1xn1+pn2xn2+ +p1x +p0,ondexeumavariaveleoscoecientespi, 0 i n 1, i Z,saoelementosdeFq.Denicao2.2.29. Umpolin omiom onicoeaquelecujocoecientelder(coecientedavariaveldemaiorexpoente)pn1eiguala1,aidentidademultiplicativadeFq.Sabemos que oconjunto de todos os polinomios sobre GF(q) formaumanel sobasopera coesusuaisdesomaemultiplica caodepolinomios. Esteanel e denotadopor GF(q)[x]ouFq[x].Denicao2.2.30. UmelementoFqeumaraizouzerodopolinomiop(x)Fq[x] sep() = 0.Teorema2.2.7. SeG eumsubgrupomultiplicativodogrupoF, )deelementos naonulosdeumcorpoF,entaoGecclico.Corolario2.2.2. Ogrupomultiplicativodetodoselementosnaonulosdeumcorponitosobaopera caomultiplica caodestecorpoecclico.Corolario2.2.3. Umaextensao(corpodeextensao)EdegraurdeumcorponitoFqeoconjuntodospolinomiossobreFqmoduloumpolinomioirredutvel degraur.Teorema2.2.8. Considereumaextensaonitadegraur sobreocorpoFq. Entaoestaextensaotemqrelementos.Denicao2.2.31. Dizemosqueumpolinomiop(x)sobreFqeprimoseeleformonicoeirredutvelsobreFq.39Captulo2. ElementosdeBiologiaeCodigosCorretoresdeErrosTeorema2.2.9. Oaneldepolinomios moduloumpolinomiop(x)sobreFqeumcorpose,esomentese,p(x)eumpolinomioprimo.Denicao2.2.32. UmgeradordogrupomultiplicativodeFqedenominadoumelementoprimitivodeFq.Corolario2.2.4. Todocorponit