CADD — комбинированное истощение, зависящее от аннотаций
CADD — это инструмент для оценки вредоносности однонуклеотидных вариантов, а также инсерционные/делеционные варианты в геноме человека.
Несмотря на то, что существует множество вариантов аннотаций и инструментов оценки, большинство аннотаций склонны использовать один тип информации (например, сохранение) и/или ограничены по объему (например, изменения миссии). Таким образом, широко применимый показатель необходимо объективно взвешивать и интегрировать разнородную информацию. Комбинированное исчерпание, зависящее от аннотаций (CADD), представляет собой структуру, которая объединяет несколько аннотаций в одну метрику, сопоставляя варианты, которые пережили естественный отбор с искусственными мутациями.
С-показатели сильно коррелируют с аллельными разнообразие, патогенность как кодирующих, так и некодирующих вариантов, а также экспериментально измеренные регуляторные эффекты, а также высокоранговые каузальные варианты внутри отдельных последовательностей генома.
CADD может количественно определять приоритеты функциональных, вредных и причинных заболеваний. вариантов в широком диапазоне функциональных категорий, размеров эффекта и генетических архитектуры и могут быть использованы для определения приоритетов причинно-следственных вариаций в как в исследованиях, так и в клинических условиях.
Помимо этого веб-сайта, CADD описан в трех публикациях. В самой последней рукописи описывается CADD-Splice (CADD v1.6), последнее расширение CADD, чтобы улучшить предсказания эффектов сплайсинга:
Ренцш П., Шубах М., Шендуре Дж., Кирхер М.
CADD-Splice — улучшение предсказания эффекта варианта в масштабе всего генома с использованием оценок сплайсинга, полученных с помощью глубокого обучения.
Геном Мед. 2021 г., 22 февраля. doi: 10.1186/s13073-021-00835-9.
PubMed PMID: 33618777.
Наша вторая рукопись описывает обновления между первоначальной публикацией и CADD v1.4, представляет CADD для GRCh48. и объясняет, как мы представляем себе использование CADD. Он был опубликован Nucleic Acids Research в 2018 году:
Ренцш П., Виттен Д., Купер Г.М., Шендур Дж., Кирхер М.
CADD: прогнозирование вредоносности вариантов во всем геноме человека.
Рез. нуклеиновых кислот. 2018 29 октября. doi: 10.1093/nar/gky1016.
PubMed PMID: 30371827.
Kircher M, Witten DM, Jain P, O’Roak BJ, Cooper GM, Shendure J.
Общая схема оценки относительной патогенности генетических вариантов человека.
Нат Жене. 2 февраля 2014 г. doi: 10.1038/ng.2892.
PubMed PMID: 24487276.
Оценки CADD находятся в свободном доступе для всех некоммерческих приложений. Если вы планируете использовать их в коммерческом приложении, вы можете получить лицензию через систему лицензирования UW CoMotion Express. Если вы сомневаетесь, нужна ли вам лицензия для вашего приложения, свяжитесь с Джей Шендур и Грегори М. Купер. В настоящее время CADD разрабатывается Мартином Кирхером, Филиппом Ренцшем, Даниэлой М. Виттен, Грегори М. Купером и Джеем Шендуром.
У нас есть предварительно рассчитанные баллы на основе CADD (C-баллы) для всех примерно 9 миллиардов возможных однонуклеотидных вариантов (SNV) эталонный геном, подборка коротких вставок/делеций, а также несколько больших наборов вариантов (например, gnomAD, ExAC, 1000 геномов, ESP). Мы также предоставляем простой поиск SNV. и включить оценку коротких вставок/удалений. Диапазоны оценок могут быть визуализированы нативно в UCSC Genome Browser или используя наши пользовательские треки (для hg19/GRCh47 и hg38/GRCh48).
CADD — комбинированная аннотация, зависящая от истощения
Оценки CADD находятся в свободном доступе для всех некоммерческих приложений. Если ты планируете использовать их в коммерческих целях, пожалуйста, получите лицензию. Если у вас есть вопросы, пожалуйста свяжитесь с нами.
Из-за больших размеров файлов мы настоятельно рекомендуем использовать менеджер закачек или другой инструмент, позволяющий продолжить прерванную загрузку (например, wget -c). Обратите внимание, что последние версии также имеют отдельный вариант загрузки через сценарий установки.
Автономные скрипты оценки для v1.6
Сценарии и README для автономной установки | файл (360K) |
Сборка генома GRCh48/hg38
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh48/hg38 | США | DE (81G) | США | ДЭ (2,6 млн) |
Все возможные СНВ ГРЧ48/хг38 вкл. все аннотации | США | DE (313G) | США | Германия (2,7 м) |
Все gnomad версии 3.0 InDels для запуска локальной установки | США | DE (1.1G) | США | DE (1,8 м) |
Все версии gnomad 3.0 InDels, вкл. все аннотации для запуска локальной установки | США | Немецкий (7,2 г) | США | Германия (2,5 м) |
Все версии gnomad 3.0 SNV | США | DE (5.9G) | США | DE (2,4 м) |
MD5Sums | США | DE | |
Все аннотации GRCh48, необходимые для автономной установки | США | DE (206G) |
Сборка генома GRCh47/hg19
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh47/hg19 | США | DE (78G) | США | DE (2,6 м) |
Все возможные SNV GRCh47/hg19 вкл. | США | DE (248G) | США | DE (2,6 м) |
48M InDels для запуска локальной установки | США | DE (591M) | США | DE (1,7 м) |
48M InDels вкл. все аннотации для запуска локальной установки | США | DE (3,5G) | США | DE (2,4 м) |
Все SNV gnomAD (версия 2.1.1) | США | DE (2.3G) | США | Германия (2,0 м) |
Все InDels gnomAD (версия 2.1.1) | США | DE (387M) | США | DE (1,6 м) |
MD5Sums | США | DE | |
Все аннотации GRCh47, необходимые для автономной установки | США | DE (129G) |
Автономные сценарии оценки для версий 1.
4 и 1.5Сценарии и README для автономной установки | файл (360K) |
Сборка генома GRCh48/hg38
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh48/hg38 | США | DE (80G) | США | Германия (2,7 м) |
Все возможные СНВ ГРЧ48/хг38 вкл. все аннотации | США | DE (292G) | США | ДЭ (2,7М) |
80M InDels для запуска локальной установки | США | DE (948M) | США | DE (1,8 м) |
80M InDels вкл. все аннотации для запуска локальной установки | США | DE (6,8G) | США | DE (2,4 м) |
Все варианты BRAVO/TOPMed (заморозка 5) | США | DE (5,5G) | США | DE (2,4 м) |
MD5Sums | США | DE | |
Все аннотации, необходимые для автономной установки | США | DE (168G) |
Сборка генома GRCh47 / hg19
Новая модель не создана, используйте CADD v1. 4 для GRCh47.
Сборка генома GRCh48/hg38
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh48/hg38 | США | DE (79G) | США | Германия (2,7 м) |
Все возможные СНВ ГРЧ48/хг38 вкл. все аннотации | США | DE (323G) | США | Германия (2,7 м) |
80M InDels для запуска локальной установки | США | DE (948M) | США | DE (1,8 м) |
80M InDels вкл. все аннотации для запуска локальной установки | США | DE (8,8 г) | США | Германия (2,5 м) |
Все варианты BRAVO/TOPMed (заморозка 5) | США | DE (5,5G) | США | DE (2,4 м) |
MD5Sums | США | DE | |
Все аннотации GRCh48, необходимые для автономной установки | США | DE (194G) |
Сборка генома GRCh47/hg19
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh47/hg19 | США | DE (78G) | США | DE (2,6 м) |
Все возможные SNV GRCh47/hg19 вкл. все аннотации | США | ДЭ (231Г) | США | DE (2,6 м) |
48M InDels для запуска локальной установки | США | DE (588M) | США | DE (1,6 м) |
48M InDels вкл. все аннотации для запуска локальной установки | США | DE (3.3G) | США | DE (2,2 м) |
Все варианты gnomAD (выпуск 2.0.1) | США | DE (2,7G) | США | DE (2,1 м) |
MD5Sums | США | DE | |
Все аннотации GRCh47, необходимые для автономной установки | США | DE (98G) |
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
1000 вариантов генома фазы 3 (SNV и InDels) | США | DE (885M) | США | DE (1,8 м) |
1000 вариантов генома фазы 3 (SNV и InDels), вкл. все аннотации | США | DE (6.1G) | США | Германия (2,5 м) |
1000 вариантов генома (SNV и InDels) | США | DE (450M) | США | DE (1,6 м) |
1000 вариантов генома (SNV и InDels), в т.ч. все аннотации | США | DE (3.3G) | США | DE (2,4 м) |
Варианты ESP6500 (SNV и InDels) | США | DE (22M) | США | DE (524K) |
Варианты ESP6500 (SNV и InDels), вкл. все аннотации | США | DE (224M) | США | DE (632K) |
Варианты консорциума агрегации экзома (r0.3) | США | DE (108M) | США | DE (592K) |
Варианты Exome Aggregation Consortium (r0.3) вкл. аннотация | США | DE (954M) | США | DE (811K) |
Варианты SNV на чипе Illumina Exome BeadChip | США | DE (2,6 м) | США | DE (408K) |
Варианты SNV на чипе Illumina Exome BeadChip | США | DE (33M) | США | DE (476K) |
Все возможные SNV GRCh47/hg19 | США | DE (80G) | США | Германия (2,7 м) |
Все возможные SNV GRCh47/hg19 вкл. все аннотации | США | DE (344G) | США | Германия (2,7 м) |
20M InDels для запуска локальной установки | США | DE (268M) | США | DE (1,6 м) |
20M InDels вкл. все аннотации для запуска локальной установки | США | DE (1,6 г) | США | DE (2,3 м) |
Все дорожки аннотаций, необходимые для автономной установки v1.3 | США | DE (206G) | |
Обновление данных WGA приматов, необходимых для автономной установки v1.3 | США | DE (3.1G) | |
Сценарии и README для автономной установки | США | DE (132K) | |
MD5Sums | США | DE |
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh47/hg19 | США | DE (79G) | США | Германия (2,7 м) |
Все возможные SNV GRCh47/hg19 вкл. все аннотации | США | DE (342G) | США | Германия (2,7 м) |
1000 вариантов генома (SNV и InDels) | США | DE (449M) | США | DE (1,7 м) |
1000 вариантов генома (SNV и InDels), в т.ч. все аннотации | США | Немецкий (3,3G) | США | DE (2,4 м) |
Варианты ESP6500 (SNV и InDels) | США | DE (22M) | США | DE (532K) |
Варианты ESP6500 (SNV и InDels), вкл. все аннотации | США | DE (224M) | США | Германия (650K) |
Варианты консорциума агрегации экзома (r0.2) | США | ДЭ (108М) | США | DE (609K) |
Варианты Exome Aggregation Consortium (r0.2) вкл. аннотация | США | DE (954M) | США | DE (811K) |
Варианты SNV на чипе Illumina Exome BeadChip | США | DE (2,6 м) | США | DE (418K) |
Варианты SNV на чипе Illumina Exome BeadChip | США | ДЭ (33М) | США | DE (493K) |
20M InDels для запуска локальной установки | США | DE (267M) | США | DE (1,6 м) |
20M InDels вкл. все аннотации для запуска локальной установки | США | DE (1,6 г) | США | DE (2,3 м) |
Все дорожки аннотаций, необходимые для автономной установки | США | ДЭ (206Г) | |
Сценарии и README для автономной установки | США | DE (132K) | |
MD5Sums | США | DE |
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh47/hg19 | США | DE (80G) | США | Германия (2,7 м) |
Все возможные СНВ ГРЧ47/hg19 вкл. все аннотации | США | DE (279G) | США | Германия (2,7 м) |
1000 вариантов генома (SNV и InDels) | США | DE (449M) | США | DE (1,6 м) |
1000 вариантов генома (SNV и InDels), в т. ч. все аннотации | США | DE (3.3G) | США | ДЭ (2,4М) |
Варианты ESP6500 (SNV и InDels) | США | DE (22M) | США | DE (524K) |
Варианты ESP6500 (SNV и InDels), вкл. все аннотации | США | DE (224M) | США | Германия (628K) |
Варианты консорциума агрегации экзома (r0.1) | США | DE (111M) | США | Германия (592K) |
Варианты Exome Aggregation Consortium (r0.1), вкл. аннотация | США | DE (955M) | США | Германия (800K) |
Варианты SNV на чипе Illumina Exome BeadChip | США | DE (2,6 м) | США | DE (408K) |
Варианты SNV на чипе Illumina Exome BeadChip | США | DE (33M) | США | Германия (476K) |
14M InDels для запуска локальной установки | США | DE (194M) | США | DE (1,6 м) |
14M InDels вкл. все аннотации для запуска локальной установки | США | DE (1.1G) | США | DE (2,1 м) |
Все дорожки аннотаций, необходимые для автономной установки | США | DE (206G) | |
Сценарии и README для автономной установки | США | DE (132K) | |
MD5Sums | США | DE |
Описание | Ссылка (Размер) | Индекс Tabix (размер) |
---|---|---|
Все возможные SNV GRCh47/hg19 | США | DE (79G) | США | Германия (2,7 м) |
Все возможные SNV GRCh47/hg19 вкл. все аннотации | США | DE (218G) | США | Германия (2,7 м) |
1000 вариантов генома (SNV и InDels) | США | DE (445M) | США | DE (1,7 м) |
Варианты ESP6500 (SNV и InDels) | США | DE (22M) | США | DE (643K) |
Варианты консорциума агрегации экзома (r0. |