{"id":7246,"date":"2020-03-23T12:40:48","date_gmt":"2020-03-23T12:40:48","guid":{"rendered":"https:\/\/www.kolabtree.com\/blog\/?p=7246"},"modified":"2023-04-18T11:12:54","modified_gmt":"2023-04-18T11:12:54","slug":"a-step-by-step-guide-to-dna-sequencing-data-analysis","status":"publish","type":"post","link":"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/","title":{"rendered":"A Step-By-Step Guide to DNA Sequencing Data Analysis"},"content":{"rendered":"<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_45_1 counter-flat ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\">Indice dei contenuti<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" area-label=\"ez-toc-toggle-icon-1\"><label for=\"item-69f1b0653b939\" aria-label=\"Table of Content\"><span style=\"display: flex;align-items: center;width: 35px;height: 30px;justify-content: center;direction:ltr;\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/label><input  type=\"checkbox\" id=\"item-69f1b0653b939\"><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#Introduction\" title=\"Introduzione\">Introduzione<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#Quality_control_QC_of_raw_reads\" title=\"Controllo di qualit\u00e0 (QC) delle letture grezze\">Controllo di qualit\u00e0 (QC) delle letture grezze<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#Read_trimming\" title=\"Leggere il taglio\">Leggere il taglio<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#Alignment\" title=\"Allineamento\">Allineamento<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#From_the_alignments\" title=\"Dagli allineamenti\">Dagli allineamenti<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#Before_you_start%E2%80%A6\" title=\"Prima di iniziare...\">Prima di iniziare...<\/a><\/li><\/ul><\/nav><\/div>\n<p><em><span style=\"font-weight: 300;\">Il dottor Javier Quilez Oliete, un esperto <a href=\"https:\/\/www.kolabtree.com\/find-an-expert\/subject\/bioinformatics\" target=\"_blank\" rel=\"noopener\">freelance bioinformatics consultant<\/a> su Kolabtree, fornisce una guida completa all'analisi dei dati di sequenziamento del DNA, compresi gli strumenti e il software utilizzato per leggere i dati.\u00a0<\/span><\/em><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Introduction\"><\/span><b>Introduzione<\/b><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><span style=\"font-weight: 300;\">L'acido desossiribonucleico (DNA) \u00e8 la molecola che porta la maggior parte delle informazioni genetiche <\/span><span style=\"font-weight: 300;\">di un organismo<\/span><span style=\"font-weight: 300;\">. (In alcuni tipi di virus, l'informazione genetica \u00e8 trasportata dall'acido ribonucleico (RNA)).  I nucleotidi (convenzionalmente rappresentati dalle lettere A, C, G o T) sono le unit\u00e0 di base delle molecole di DNA. Concettualmente, <a href=\"https:\/\/www.kolabtree.com\/find-an-expert\/subject\/dna-sequencing?utm_source=Blog&amp;utm_medium=Post&amp;utm_campaign=DNASeqGuide\">Sequenziamento del DNA<\/a> \u00e8 il processo di lettura dei nucleotidi che compongono una molecola di DNA (ad esempio, \"GCAAACCAAT\" \u00e8 una stringa di DNA di 10 nucleotidi). Le attuali tecnologie di sequenziamento producono milioni di tali letture del DNA <\/span><span style=\"font-weight: 300;\">in un tempo ragionevole e ad un costo relativamente basso. Come riferimento, il costo del sequenziamento di un genoma umano - un genoma \u00e8 l'insieme completo delle molecole di DNA in un organismo - \u00e8 sceso il <\/span><a href=\"https:\/\/www.technologyreview.com\/s\/615289\/china-bgi-100-dollar-genome\/\"><span style=\"font-weight: 300;\">barriera $100<\/span><\/a><span style=\"font-weight: 300;\"> e pu\u00f2 essere fatto in pochi giorni. Questo contrasta con la prima iniziativa di sequenziare il <\/span><a href=\"https:\/\/www.nature.com\/articles\/35057062\"><span style=\"font-weight: 300;\">genoma umano<\/span><\/a><span style=\"font-weight: 300;\">che \u00e8 stato completato in un decennio e ha avuto un costo di circa $2,7 miliardi.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Questa capacit\u00e0 di sequenziare il DNA ad alto rendimento e a basso costo ha permesso lo sviluppo di un numero crescente di metodi e applicazioni basati sul sequenziamento. Per esempio, il sequenziamento di interi genomi o delle loro regioni codificanti le proteine (due approcci noti rispettivamente come sequenziamento del genoma intero e dell'esoma) in individui malati e sani pu\u00f2 suggerire alterazioni del DNA che causano malattie. Inoltre, il sequenziamento dell'RNA che viene trascritto dal DNA - una tecnica nota come RNA-sequencing - \u00e8 usato per quantificare l'attivit\u00e0 genica e come questa cambia in diverse condizioni (per esempio, non trattato contro trattamento). Dall'altro lato, i metodi di sequenziamento della conformazione dei cromosomi rilevano le interazioni tra le molecole di DNA vicine e quindi aiutano a determinare la distribuzione spaziale dei cromosomi all'interno della cellula.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Comune a queste e altre applicazioni del sequenziamento del DNA \u00e8 la generazione di set di dati nell'ordine dei gigabyte e comprendenti milioni di sequenze lette. Pertanto, dare un senso agli esperimenti di sequenziamento ad alta produttivit\u00e0 (HTS) richiede notevoli capacit\u00e0 di analisi dei dati. Fortunatamente, esistono strumenti computazionali e statistici dedicati e flussi di lavoro di analisi relativamente standard per la maggior parte dei tipi di dati HTS. Mentre alcune delle fasi (iniziali) di analisi sono comuni alla maggior parte dei tipi di dati di sequenziamento, l'analisi pi\u00f9 a valle dipender\u00e0 dal tipo di dati e\/o dall'obiettivo finale dell'analisi. Di seguito fornisco un primer sui passi fondamentali nell'analisi dei dati HTS e faccio riferimento a strumenti popolari.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Alcune delle sezioni seguenti sono focalizzate sull'analisi dei dati generati dalle tecnologie di sequenziamento a lettura breve (per lo pi\u00f9 <\/span><a href=\"https:\/\/www.illumina.com\/\"><span style=\"font-weight: 300;\">Illumina<\/span><\/a><span style=\"font-weight: 300;\">), poich\u00e9 questi hanno storicamente dominato il mercato HTS. Tuttavia, le nuove tecnologie che generano letture pi\u00f9 lunghe (ad es. <\/span><a href=\"https:\/\/nanoporetech.com\/\"><span style=\"font-weight: 300;\">Tecnologie Oxford Nanopore<\/span><\/a><span style=\"font-weight: 300;\">, <\/span><a href=\"https:\/\/www.pacb.com\/\"><span style=\"font-weight: 300;\">PacBio<\/span><\/a><span style=\"font-weight: 300;\">) stanno guadagnando terreno rapidamente. Poich\u00e9 il sequenziamento a lettura lunga ha alcune particolarit\u00e0 (ad esempio, tassi di errore pi\u00f9 elevati), si stanno sviluppando strumenti specifici per l'analisi di questo tipo di dati.\u00a0<\/span><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Quality_control_QC_of_raw_reads\"><\/span><b>Controllo di qualit\u00e0 (QC) delle letture grezze<\/b><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><span style=\"font-weight: 300;\">L'analista impaziente inizier\u00e0 l'analisi dai file FASTQ; il <\/span><a href=\"https:\/\/en.wikipedia.org\/wiki\/FASTQ_format\"><span style=\"font-weight: 300;\">Formato FASTQ<\/span><\/a><span style=\"font-weight: 300;\"> \u00e8 stato a lungo lo standard per memorizzare i dati di sequenziamento a lettura breve. In sostanza, i file FASTQ contengono la sequenza nucleotidica e la per-base<\/span><span style=\"font-weight: 300;\"> qualit\u00e0 di chiamata per milioni di letture. Anche se la dimensione del file dipende dal numero effettivo di letture, i file FASTQ sono tipicamente grandi (nell'ordine di megabyte e gigabyte) e compressi. Da notare che la maggior parte degli strumenti che usano i file FASTQ come input possono gestirli in formato compresso quindi, al fine di risparmiare spazio su disco, si raccomanda di non decomprimerli. Per convenzione, qui equiparer\u00f2 un file FASTQ a un campione di sequenziamento.<\/span><\/p>\n<p><a href=\"https:\/\/www.bioinformatics.babraham.ac.uk\/projects\/fastqc\/\"><span style=\"font-weight: 300;\">FastQC<\/span><\/a><span style=\"font-weight: 300;\"> \u00e8 probabilmente lo strumento pi\u00f9 popolare per effettuare il CQ delle letture grezze. Pu\u00f2 essere eseguito attraverso un'interfaccia visiva o programmaticamente. Mentre la prima opzione pu\u00f2 essere pi\u00f9 conveniente per gli utenti che non si sentono a proprio agio con l'ambiente a riga di comando, la seconda offre una scalabilit\u00e0 e riproducibilit\u00e0 incomparabili (pensate a quanto noioso e soggetto a errori pu\u00f2 essere eseguire manualmente lo strumento per decine di file). In entrambi i casi, l'output principale di FastQC \u00e8 un <\/span><a href=\"https:\/\/www.bioinformatics.babraham.ac.uk\/projects\/fastqc\/good_sequence_short_fastqc.html\"><span style=\"font-weight: 300;\">file HTML<\/span><\/a><span style=\"font-weight: 300;\"> riportando statistiche riassuntive chiave sulla qualit\u00e0 complessiva delle letture di sequenziamento grezze di un dato campione. Ispezionare decine di rapporti FastQC uno per uno \u00e8 noioso e complica il confronto tra i campioni. Pertanto, si potrebbe desiderare di utilizzare <\/span><a href=\"https:\/\/multiqc.info\/\"><span style=\"font-weight: 300;\">MultiQC<\/span><\/a><span style=\"font-weight: 300;\">che aggrega i rapporti HTML da FastQC (cos\u00ec come da altri strumenti utilizzati a valle, ad esempio il trimming dell'adattatore, l'allineamento) in un unico rapporto<\/span><span style=\"font-weight: 300;\">.<\/span><\/p>\n<div id=\"attachment_7265\" style=\"width: 712px\" class=\"wp-caption alignnone\"><img aria-describedby=\"caption-attachment-7265\" decoding=\"async\" loading=\"lazy\" class=\"wp-image-7265 size-large\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-1024x576.png\" alt=\"\" width=\"702\" height=\"395\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-1024x576.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-300x169.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-768x432.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-1536x864.png 1536w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-1080x608.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC.png 1600w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/MultiQC-300x169@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><p id=\"caption-attachment-7265\" class=\"wp-caption-text\">MultiQC<\/p><\/div>\n<p><span style=\"font-weight: 300;\">Le informazioni QC hanno lo scopo di permettere all'utente di giudicare se i campioni hanno una buona qualit\u00e0 e possono quindi essere utilizzati per le fasi successive o devono essere scartati. Sfortunatamente, non esiste una soglia di consenso basata sulla metrica FastQC per classificare i campioni come di buona o cattiva qualit\u00e0. L'approccio che utilizzo \u00e8 il seguente. Mi aspetto che tutti i campioni che sono passati attraverso la stessa procedura (ad esempio estrazione del DNA, preparazione della libreria) abbiano statistiche di qualit\u00e0 simili e una maggioranza di bandiere \"pass\". Se alcuni campioni hanno una qualit\u00e0 inferiore alla media, li user\u00f2 comunque nell'analisi a valle tenendo conto di questo. D'altra parte, se tutti i campioni nell'esperimento ottengono sistematicamente \"warning\" o \"fail\" flag in pi\u00f9 metriche (vedi <\/span><a href=\"https:\/\/www.bioinformatics.babraham.ac.uk\/projects\/fastqc\/bad_sequence_fastqc.html\"><span style=\"font-weight: 300;\">questo esempio<\/span><\/a><span style=\"font-weight: 300;\">), sospetto che qualcosa sia andato storto nell'esperimento (ad es. cattiva qualit\u00e0 del DNA, preparazione della libreria, ecc.<\/span><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Read_trimming\"><\/span><b>Leggere il taglio<\/b><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><span style=\"font-weight: 300;\">Il QC delle letture grezze aiuta a identificare i campioni problematici, ma non migliora la qualit\u00e0 effettiva delle letture. Per fare ci\u00f2, abbiamo bisogno di tagliare le letture per rimuovere le sequenze tecniche e le estremit\u00e0 di bassa qualit\u00e0.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Le sequenze tecniche sono avanzi della procedura sperimentale (ad es. adattatori di sequenziamento). Se tali sequenze sono adiacenti alla vera sequenza della lettura, l'allineamento (vedi sotto) pu\u00f2 mappare le letture nella posizione sbagliata nel genoma o diminuire la fiducia in un dato allineamento. Oltre alle sequenze tecniche, potremmo anche voler rimuovere sequenze di origine biologica se queste sono altamente presenti tra le letture. Per esempio, procedure di preparazione del DNA non ottimali possono lasciare un'alta percentuale di RNA ribosomiale (rRNA) convertito in DNA nel campione. A meno che questo tipo di acido nucleico \u00e8 l'obiettivo dell'esperimento di sequenziamento, mantenendo letture derivate da rRNA aumenter\u00e0 solo il carico computazionale dei passaggi a valle e pu\u00f2 confondere i risultati. Da notare che se i livelli di sequenze tecniche, di rRNA o di altri contaminanti sono molto alti, che probabilmente saranno gi\u00e0 stati evidenziati dal QC, si potrebbe scartare l'intero campione di sequenziamento.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Nel sequenziamento a lettura breve, la sequenza del DNA \u00e8 determinata un nucleotide alla volta (tecnicamente, un nucleotide ogni ciclo di sequenziamento). In altre parole, il numero di cicli di sequenziamento determina la lunghezza della lettura. Un problema noto dei metodi di sequenziamento HTS \u00e8 il decadimento della precisione con cui vengono determinati i nucleotidi con l'accumularsi dei cicli di sequenziamento. Questo si riflette in una diminuzione complessiva della qualit\u00e0 di chiamata per base soprattutto verso la fine della lettura. Come accade con le sequenze tecniche, cercare di allineare le letture che contengono estremit\u00e0 di bassa qualit\u00e0 pu\u00f2 portare a un posizionamento errato o a una scarsa qualit\u00e0 di mappatura.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Per rimuovere le sequenze tecniche\/contaminanti e le estremit\u00e0 di bassa qualit\u00e0, leggi gli strumenti di trimming come <\/span><a href=\"http:\/\/www.usadellab.org\/cms\/?page=trimmomatic\"><span style=\"font-weight: 300;\">Trimmomatic<\/span><\/a><span style=\"font-weight: 300;\"> e <\/span><a href=\"https:\/\/cutadapt.readthedocs.io\/en\/stable\/\"><span style=\"font-weight: 300;\">Cutadapt<\/span><\/a><span style=\"font-weight: 300;\"> esistono e sono ampiamente utilizzati. In sostanza, tali strumenti rimuovono le sequenze tecniche (disponibili internamente e\/o fornite dall'utente) e tagliano le letture in base alla qualit\u00e0, massimizzando la lunghezza della lettura. Le letture che rimangono troppo corte dopo il trimming vengono scartate (le letture eccessivamente corte, ad esempio &lt;36 nucleotidi, complicano la fase di allineamento in quanto queste probabilmente mapperanno su pi\u00f9 siti nel genoma). Potresti voler guardare la percentuale di letture che sopravvivono al trimming, poich\u00e9 un alto tasso di letture scartate \u00e8 probabilmente un segno di dati di cattiva qualit\u00e0.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Infine, di solito eseguo nuovamente FastQC sulle letture tagliate per verificare che questo passo sia stato efficace e abbia sistematicamente migliorato le metriche di QC.<\/span><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Alignment\"><\/span><b>Allineamento<\/b><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><span style=\"font-weight: 300;\">Con eccezioni (ad esempio <\/span><a href=\"https:\/\/en.wikipedia.org\/wiki\/De_novo_sequence_assemblers\"><span style=\"font-weight: 300;\">assemblaggio de novo<\/span><\/a><span style=\"font-weight: 300;\">), l'allineamento (detto anche mappatura) \u00e8 tipicamente il passo successivo per la maggior parte dei tipi di dati e applicazioni HTS. L'allineamento delle letture consiste nel determinare la posizione nel genoma da cui deriva la sequenza della lettura (tipicamente espressa come cromosoma:start-end). Quindi, in questa fase si richiede l'uso di una sequenza di riferimento su cui allineare\/mappare le letture.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">La scelta della sequenza di riferimento sar\u00e0 determinata da molteplici fattori. Per esempio, la specie da cui deriva il DNA sequenziato. Mentre il numero di specie con una sequenza di riferimento di alta qualit\u00e0 disponibile sta aumentando, questo potrebbe non essere ancora il caso per alcuni organismi meno studiati. In questi casi, potresti voler allineare le letture a una specie evolutivamente vicina per la quale \u00e8 disponibile un genoma di riferimento. Per esempio, dato che non esiste una sequenza di riferimento per il genoma del coyote, possiamo usare quella del cane strettamente correlato per l'allineamento delle letture. Allo stesso modo, potremmo ancora voler allineare le nostre letture a una specie strettamente correlata per la quale esiste una sequenza di riferimento di qualit\u00e0 superiore. Per esempio, mentre il genoma del gibbone \u00e8 stato <\/span><a href=\"https:\/\/www.nature.com\/articles\/nature13679\"><span style=\"font-weight: 300;\">pubblicato<\/span><\/a><span style=\"font-weight: 300;\">, questo \u00e8 rotto in migliaia di frammenti che non ricapitolano completamente l'organizzazione di quel genoma in decine di cromosomi; in questo caso, effettuare l'allineamento usando la sequenza umana di riferimento pu\u00f2 essere utile.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Un altro fattore da considerare \u00e8 la versione dell'assemblaggio della sequenza di riferimento, poich\u00e9 vengono rilasciate nuove versioni man mano che la sequenza viene aggiornata e migliorata. \u00c8 importante notare che le coordinate di un dato allineamento possono variare tra le versioni. Per esempio, pi\u00f9 versioni del genoma umano possono essere trovate nel file <\/span><a href=\"https:\/\/genome.ucsc.edu\/cgi-bin\/hgGateway?redirect=manual&amp;source=genome.ucsc.edu\"><span style=\"font-weight: 300;\">UCSC Genome Browser<\/span><\/a><span style=\"font-weight: 300;\">. In ogni specie, favorisco fortemente la migrazione alla pi\u00f9 recente versione dell'assemblaggio una volta che \u00e8 completamente rilasciata. Questo pu\u00f2 causare qualche fastidio durante la transizione, poich\u00e9 i risultati gi\u00e0 esistenti saranno relativi a versioni pi\u00f9 vecchie, ma alla lunga ripaga.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Inoltre, anche il tipo di dati di sequenziamento \u00e8 importante. Le letture generate da DNA-seq, ChIP-seq o protocolli Hi-C saranno allineate alla sequenza di riferimento del genoma. D'altra parte, poich\u00e9 l'RNA trascritto dal DNA viene ulteriormente trasformato in mRNA (cio\u00e8 gli introni rimossi), molte letture RNA-seq non riusciranno ad allinearsi a una sequenza di riferimento del genoma. Invece, abbiamo bisogno di allinearli alle sequenze di riferimento del trascrittoma o di usare allineatori consapevoli della divisione (vedi sotto) quando si usa la sequenza del genoma come riferimento. Correlata a questo \u00e8 la scelta della fonte per l'annotazione della sequenza di riferimento, cio\u00e8 il database con le coordinate dei geni, trascrizioni, centromeri, ecc. Di solito uso il database <\/span><a href=\"https:\/\/www.gencodegenes.org\/human\/\"><span style=\"font-weight: 300;\">Annotazione GENCODE<\/span><\/a><span style=\"font-weight: 300;\"> in quanto combina l'annotazione completa dei geni e le sequenze di trascrizione.<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Una lunga lista di strumenti di allineamento di sequenze a lettura breve \u00e8 stata sviluppata (vedi la sezione Allineamento di sequenze a lettura breve <\/span><a href=\"https:\/\/en.wikipedia.org\/wiki\/List_of_sequence_alignment_software\"><span style=\"font-weight: 300;\">qui<\/span><\/a><span style=\"font-weight: 300;\">). Esaminarli va oltre lo scopo di questo articolo (i dettagli sugli algoritmi dietro questi strumenti possono essere trovati <\/span><a href=\"https:\/\/www.ncbi.nlm.nih.gov\/pmc\/articles\/PMC5425171\/\"><span style=\"font-weight: 300;\">qui<\/span><\/a><span style=\"font-weight: 300;\">). Nella mia esperienza, tra i pi\u00f9 popolari ci sono <\/span><a href=\"http:\/\/bowtie-bio.sourceforge.net\/bowtie2\/index.shtml\"><span style=\"font-weight: 300;\">Bowtie2<\/span><\/a><span style=\"font-weight: 300;\">, <\/span><a href=\"http:\/\/bio-bwa.sourceforge.net\/\"><span style=\"font-weight: 300;\">BWA<\/span><\/a><span style=\"font-weight: 300;\">, <\/span><a href=\"http:\/\/daehwankimlab.github.io\/hisat2\/\"><span style=\"font-weight: 300;\">HISAT2<\/span><\/a><span style=\"font-weight: 300;\">, <\/span><a href=\"https:\/\/github.com\/lh3\/minimap2\"><span style=\"font-weight: 300;\">Minimap2<\/span><\/a><span style=\"font-weight: 300;\">, <\/span><a href=\"https:\/\/www.ncbi.nlm.nih.gov\/pmc\/articles\/PMC3530905\/\"><span style=\"font-weight: 300;\">STAR<\/span><\/a><span style=\"font-weight: 300;\"> e <\/span><a href=\"http:\/\/ccb.jhu.edu\/software\/tophat\/index.shtml\"><span style=\"font-weight: 300;\">TopHat<\/span><\/a><span style=\"font-weight: 300;\">. La mia raccomandazione \u00e8 che tu scelga il tuo allineatore in base a fattori chiave come il tipo di dati HTS<\/span><span style=\"font-weight: 300;\"> e l'applicazione cos\u00ec come l'accettazione da parte della comunit\u00e0, la qualit\u00e0 della documentazione e il numero di utenti. Ad esempio, si ha bisogno di allineatori come STAR o Bowtie2 che sono consapevoli delle giunzioni esone-esone quando si mappano RNA-seq al genoma.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Comune alla maggior parte dei mappatori \u00e8 la necessit\u00e0 di indicizzare la sequenza usata come riferimento prima che l'allineamento effettivo abbia luogo. Questo passo pu\u00f2 richiedere molto tempo, ma deve essere fatto solo una volta per ogni sequenza di riferimento. La maggior parte dei mappatori memorizza gli allineamenti in file SAM\/BAM, che seguono il modello <\/span><a href=\"https:\/\/samtools.github.io\/hts-specs\/SAMv1.pdf\"><span style=\"font-weight: 300;\">Formato SAM\/BAM<\/span><\/a><span style=\"font-weight: 300;\"> (I file BAM sono versioni binarie dei file SAM). L'allineamento \u00e8 uno dei passi pi\u00f9 impegnativi in termini di calcolo e di tempo nell'analisi dei dati di sequenziamento e i file SAM\/BAM sono pesanti (nell'ordine dei gigabyte). Pertanto, \u00e8 importante assicurarsi di avere le risorse necessarie (vedi la sezione finale sotto) per eseguire l'allineamento in un tempo ragionevole e memorizzare i risultati. Allo stesso modo, a causa delle dimensioni e del formato binario dei file BAM, evitate di aprirli con editor di testo; usate invece comandi Unix o strumenti dedicati come <\/span><a href=\"http:\/\/www.htslib.org\/\"><span style=\"font-weight: 300;\">SAMtools<\/span><\/a><span style=\"font-weight: 300;\">.<\/span><\/p>\n<h2><span class=\"ez-toc-section\" id=\"From_the_alignments\"><\/span><b>Dagli allineamenti<\/b><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><span style=\"font-weight: 300;\">Direi che non c'\u00e8 un chiaro passo comune dopo l'allineamento, poich\u00e9 a questo punto \u00e8 dove ogni tipo di dati HTS e applicazione pu\u00f2 differire.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Un'analisi a valle comune per i dati DNA-seq \u00e8 la chiamata delle varianti, cio\u00e8 l'identificazione delle posizioni nel genoma che variano rispetto al riferimento del genoma e tra gli individui. Un quadro di analisi popolare per questa applicazione \u00e8 <\/span><a href=\"https:\/\/gatk.broadinstitute.org\/hc\/en-us\"><span style=\"font-weight: 300;\">GATK<\/span><\/a><span style=\"font-weight: 300;\"> per polimorfismo a singolo nucleotide (SNP) o piccole inserzioni\/delezioni (indel) (<\/span><b>Figura 2<\/b><span style=\"font-weight: 300;\">). Le varianti che comprendono pezzi pi\u00f9 grandi di DNA (dette anche varianti strutturali) richiedono metodi di chiamata dedicati (vedi <\/span><a href=\"https:\/\/genomebiology.biomedcentral.com\/articles\/10.1186\/s13059-019-1720-5\"><span style=\"font-weight: 300;\">questo articolo<\/span><\/a><span style=\"font-weight: 300;\"> per un confronto completo). Come per gli allineatori, consiglio di selezionare lo strumento giusto considerando fattori chiave come il tipo di varianti (SNP, indel o varianti strutturali), l'accettazione da parte della comunit\u00e0, la qualit\u00e0 della documentazione e il numero di utenti.<\/span><\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-7262 size-large\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-1024x576.png\" alt=\"\" width=\"702\" height=\"395\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-1024x576.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-300x169.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-768x432.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-1536x864.png 1536w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-1080x608.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk.png 1600w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/gatk-300x169@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p><span style=\"font-weight: 300;\">Probabilmente l'applicazione pi\u00f9 frequente di RNA-seq \u00e8 la quantificazione dell'espressione genica. Storicamente, le letture dovevano essere allineate alla sequenza di riferimento e poi il numero di letture allineate a un dato gene o trascrizione veniva usato come proxy per quantificare i suoi livelli di espressione. Questo approccio di allineamento+quantificazione viene eseguito da strumenti come <\/span><a href=\"http:\/\/cole-trapnell-lab.github.io\/cufflinks\/manual\/\"><span style=\"font-weight: 300;\">Gemelli<\/span><\/a><span style=\"font-weight: 300;\">, <\/span><a href=\"https:\/\/github.com\/deweylab\/RSEM\"><span style=\"font-weight: 300;\">RSEM<\/span><\/a><span style=\"font-weight: 300;\"> o <\/span><a href=\"http:\/\/subread.sourceforge.net\/\"><span style=\"font-weight: 300;\">featureCounts<\/span><\/a><span style=\"font-weight: 300;\">. Tuttavia, questo approccio \u00e8 stato sempre pi\u00f9 superato da nuovi metodi implementati in software come <\/span><a href=\"https:\/\/pachterlab.github.io\/kallisto\/\"><span style=\"font-weight: 300;\">Kallisto<\/span><\/a><span style=\"font-weight: 300;\"> e <\/span><a href=\"https:\/\/combine-lab.github.io\/salmon\/\"><span style=\"font-weight: 300;\">Salmone<\/span><\/a><span style=\"font-weight: 300;\">. Concettualmente, con tali strumenti la sequenza completa di una lettura non ha bisogno di essere allineata alla sequenza di riferimento. Invece, abbiamo solo bisogno di allineare abbastanza nucleotidi per essere sicuri che una lettura provenga da una data trascrizione. In parole povere, l'approccio di allineamento+quantificazione si riduce a un solo passo. Questo approccio \u00e8 noto come pseudo-mapping e aumenta notevolmente la velocit\u00e0 della quantificazione dell'espressione genica. D'altra parte, tenete a mente che lo pseudo-mapping non sar\u00e0 adatto per le applicazioni in cui \u00e8 necessario l'allineamento completo (ad esempio la chiamata delle varianti dai dati RNA-seq).<\/span><\/p>\n<p><span style=\"font-weight: 300;\">Un altro esempio delle differenze nelle fasi di analisi a valle e gli strumenti necessari in tutta l'applicazione basata sul sequenziamento \u00e8 ChIP-seq. Le letture generate con tale tecnica saranno utilizzate per il peak calling, che consiste nel rilevare le regioni nel genoma con un eccesso significativo di letture che indica dove la proteina target \u00e8 legata. Esistono diversi peak caller e <\/span><a href=\"https:\/\/academic.oup.com\/bib\/article\/18\/3\/441\/2453291\"><span style=\"font-weight: 300;\">questa pubblicazione<\/span><\/a><span style=\"font-weight: 300;\"> le indagini. Come ultimo esempio citer\u00f2 i dati Hi-C, in cui gli allineamenti sono usati come input per strumenti che determinano le matrici di interazione e, da queste, le caratteristiche 3D del genoma. Commentare tutti i saggi basati sul sequenziamento va oltre lo scopo di questo articolo (per un elenco relativamente completo vedere <\/span><a href=\"https:\/\/liorpachter.wordpress.com\/seq\/\"><span style=\"font-weight: 300;\">questo articolo<\/span><\/a><span style=\"font-weight: 300;\">).<\/span><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Before_you_start%E2%80%A6\"><\/span><b>Prima di iniziare...<\/b><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><span style=\"font-weight: 300;\">La parte restante di questo articolo tocca aspetti che possono non essere strettamente considerati come passi nell'analisi dei dati HTS e che sono ampiamente ignorati. Al contrario, io sostengo che \u00e8 capitale che si pensi alle domande poste in <\/span><b>Tabella 1<\/b><span style=\"font-weight: 300;\"> prima di iniziare ad analizzare i dati HTS (o qualsiasi tipo di dati), e ho scritto su questi argomenti <\/span><a href=\"https:\/\/www.slideshare.net\/slideshow\/embed_code\/key\/vwyxcqSsQTYBhl\"><span style=\"font-weight: 300;\">qui<\/span><\/a><span style=\"font-weight: 300;\"> e <\/span><a href=\"https:\/\/academic.oup.com\/gigascience\/article\/6\/11\/gix100\/4557140\"><span style=\"font-weight: 300;\">qui<\/span><\/a><span style=\"font-weight: 300;\">.<\/span><\/p>\n<p><b>Tabella 1<\/b><\/p>\n<table>\n<tbody>\n<tr>\n<td><b>Pensateci<\/b><\/td>\n<td><b>Azione proposta<\/b><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 300;\">Avete tutte le informazioni del vostro campione necessarie per l'analisi?<\/span><\/td>\n<td><span style=\"font-weight: 300;\">Raccogliere sistematicamente i metadati degli esperimenti<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 300;\">Sar\u00e0 in grado di identificare inequivocabilmente il suo campione?<\/span><\/td>\n<td><span style=\"font-weight: 300;\">Stabilire un sistema per assegnare ad ogni campione un identificatore unico<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 300;\">Dove saranno i dati e i risultati?<\/span><\/td>\n<td><span style=\"font-weight: 300;\">Organizzazione strutturata e gerarchica dei dati<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 300;\">Sar\u00e0 in grado di elaborare pi\u00f9 campioni senza soluzione di continuit\u00e0?<\/span><\/td>\n<td><span style=\"font-weight: 300;\">Scalabilit\u00e0, parallelizzazione, configurazione automatica e modularit\u00e0 del codice<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 300;\">Lei o qualcun altro sar\u00e0 in grado di riprodurre i risultati?<\/span><\/td>\n<td><span style=\"font-weight: 300;\">Documentate il vostro codice e le vostre procedure!<\/span><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>&nbsp;<\/p>\n<p><span style=\"font-weight: 300;\">Come menzionato sopra, i dati grezzi HTS e alcuni dei file generati durante la loro analisi sono dell'ordine dei gigabyte, quindi non \u00e8 eccezionale che un progetto che include decine di campioni richieda terabyte di memoria. Inoltre, alcuni passi nell'analisi dei dati HTS sono computazionalmente intensivi (per esempio l'allineamento). Tuttavia, l'infrastruttura di stoccaggio e di calcolo necessaria per l'analisi dei dati HTS \u00e8 una considerazione importante e spesso viene trascurata o non discussa. Come esempio, come parte di una recente analisi, abbiamo esaminato decine di articoli pubblicati che eseguono analisi di associazione a livello di fenoma (PheWAS). Le moderne PheWAS analizzano 100-1.000s sia di varianti genetiche che di fenotipi, il che comporta un'importante archiviazione di dati e potenza di calcolo. Eppure, praticamente nessuno dei documenti che abbiamo esaminato ha commentato l'infrastruttura necessaria per l'analisi PheWAS. Non sorprende che la mia raccomandazione sia quella di pianificare in anticipo i requisiti di archiviazione e di calcolo che si dovranno affrontare e condividerli con la comunit\u00e0.<\/span><\/p>\n<p><strong>Hai bisogno di aiuto per analizzare i dati di sequenziamento del DNA? Mettiti in contatto con <a href=\"https:\/\/www.kolabtree.com\/find-an-expert\/subject\/bioinformatics?utm_source=Blog&amp;utm_medium=Post&amp;utm_campaign=DNASeqGuide\">freelance bioinformatics specialist<\/a> e <a href=\"https:\/\/www.kolabtree.com\/find-an-expert\/subject\/genomics\">esperti di genomica<\/a> su Kolabtree.\u00a0<\/strong><\/p>","protected":false},"excerpt":{"rendered":"<p>Dr. Javier Quilez Oliete, an experienced freelance bioinformatics consultant on Kolabtree, provides a comprehensive guide to DNA sequencing data analysis, including tools and software used to read data.\u00a0 Introduction Deoxyribonucleic acid (DNA) is the molecule that carries most of the genetic information of an organism. (In some types of virus, genetic information is carried by<\/p>\n<div class=\"read-more\"><a href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/\" title=\"Per saperne di pi\u00f9\">Per saperne di pi\u00f9<\/a><\/div>","protected":false},"author":12,"featured_media":7266,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[442,398,435],"tags":[755,754],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v20.1 (Yoast SEO v20.1) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>A Step-By-Step Guide to DNA Sequencing Data Analysis<\/title>\n<meta name=\"description\" content=\"An expert guide to DNA sequencing data analysis, including tools used for reading raw data, trimming reads and quality control.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"A Step-By-Step Guide to DNA Sequencing Data Analysis\" \/>\n<meta property=\"og:description\" content=\"An expert guide to DNA sequencing data analysis, including tools used for reading raw data, trimming reads and quality control.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/\" \/>\n<meta property=\"og:site_name\" content=\"The Kolabtree Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/kolabtree\" \/>\n<meta property=\"article:published_time\" content=\"2020-03-23T12:40:48+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-04-18T11:12:54+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/dna-sequencing-data-analysis-guide.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1350\" \/>\n\t<meta property=\"og:image:height\" content=\"900\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Ramya Sriram\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@kolabtree\" \/>\n<meta name=\"twitter:site\" content=\"@kolabtree\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"Ramya Sriram\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"13 minuti\" \/>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"A Step-By-Step Guide to DNA Sequencing Data Analysis","description":"An expert guide to DNA sequencing data analysis, including tools used for reading raw data, trimming reads and quality control.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/","og_locale":"it_IT","og_type":"article","og_title":"A Step-By-Step Guide to DNA Sequencing Data Analysis","og_description":"An expert guide to DNA sequencing data analysis, including tools used for reading raw data, trimming reads and quality control.","og_url":"https:\/\/www.kolabtree.com\/blog\/it\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/","og_site_name":"The Kolabtree Blog","article_publisher":"https:\/\/www.facebook.com\/kolabtree","article_published_time":"2020-03-23T12:40:48+00:00","article_modified_time":"2023-04-18T11:12:54+00:00","og_image":[{"width":1350,"height":900,"url":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2020\/03\/dna-sequencing-data-analysis-guide.jpg","type":"image\/jpeg"}],"author":"Ramya Sriram","twitter_card":"summary_large_image","twitter_creator":"@kolabtree","twitter_site":"@kolabtree","twitter_misc":{"Scritto da":"Ramya Sriram","Tempo di lettura stimato":"13 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#article","isPartOf":{"@id":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/"},"author":{"name":"Ramya Sriram","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/81992f5863a1b06d132a47822e7b4400"},"headline":"A Step-By-Step Guide to DNA Sequencing Data Analysis","datePublished":"2020-03-23T12:40:48+00:00","dateModified":"2023-04-18T11:12:54+00:00","mainEntityOfPage":{"@id":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/"},"wordCount":2769,"commentCount":0,"publisher":{"@id":"https:\/\/www.kolabtree.com\/blog\/#organization"},"keywords":["DNA Sequencing Data Analysts","Freelance Bioinformatics Consultants"],"articleSection":["Biotechnology","Data Science","Research"],"inLanguage":"it-IT","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/","url":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/","name":"A Step-By-Step Guide to DNA Sequencing Data Analysis","isPartOf":{"@id":"https:\/\/www.kolabtree.com\/blog\/#website"},"datePublished":"2020-03-23T12:40:48+00:00","dateModified":"2023-04-18T11:12:54+00:00","description":"An expert guide to DNA sequencing data analysis, including tools used for reading raw data, trimming reads and quality control.","breadcrumb":{"@id":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.kolabtree.com\/blog\/a-step-by-step-guide-to-dna-sequencing-data-analysis\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.kolabtree.com\/blog\/"},{"@type":"ListItem","position":2,"name":"A Step-By-Step Guide to DNA Sequencing Data Analysis"}]},{"@type":"WebSite","@id":"https:\/\/www.kolabtree.com\/blog\/#website","url":"https:\/\/www.kolabtree.com\/blog\/","name":"The Kolabtree Blog","description":"Expert Views on Science, Innovation and Product Development","publisher":{"@id":"https:\/\/www.kolabtree.com\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.kolabtree.com\/blog\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Organization","@id":"https:\/\/www.kolabtree.com\/blog\/#organization","name":"Kolabtree","url":"https:\/\/www.kolabtree.com\/blog\/","logo":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/logo\/image\/","url":"","contentUrl":"","caption":"Kolabtree"},"image":{"@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/kolabtree","https:\/\/twitter.com\/kolabtree","https:\/\/instagram.com\/kolabtree","https:\/\/www.linkedin.com\/company\/kolabtree","https:\/\/en.m.wikipedia.org\/wiki\/Kolabtree"]},{"@type":"Person","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/81992f5863a1b06d132a47822e7b4400","name":"Ramya Sriram","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/8100b45c960ebbbbe420e8b3f250515f?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/8100b45c960ebbbbe420e8b3f250515f?s=96&d=mm&r=g","caption":"Ramya Sriram"},"description":"Ramya Sriram manages digital content and communications at Kolabtree (kolabtree.com), the world's largest freelancing platform for scientists. She has over a decade of experience in publishing, advertising and digital content creation.","url":"https:\/\/www.kolabtree.com\/blog\/it\/author\/ramyas\/"}]}},"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/posts\/7246"}],"collection":[{"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/users\/12"}],"replies":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/comments?post=7246"}],"version-history":[{"count":8,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/posts\/7246\/revisions"}],"predecessor-version":[{"id":10583,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/posts\/7246\/revisions\/10583"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/media\/7266"}],"wp:attachment":[{"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/media?parent=7246"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/categories?post=7246"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/it\/wp-json\/wp\/v2\/tags?post=7246"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}