Cadd: CADD – Combined Annotation Dependent Depletion

CADD — комбинированное истощение, зависящее от аннотаций

CADD — это инструмент для оценки вредоносности однонуклеотидных вариантов, а также инсерционные/делеционные варианты в геноме человека.

Несмотря на то, что существует множество вариантов аннотаций и инструментов оценки, большинство аннотаций склонны использовать один тип информации (например, сохранение) и/или ограничены по объему (например, изменения миссии). Таким образом, широко применимый показатель необходимо объективно взвешивать и интегрировать разнородную информацию. Комбинированное исчерпание, зависящее от аннотаций (CADD), представляет собой структуру, которая объединяет несколько аннотаций в одну метрику, сопоставляя варианты, которые пережили естественный отбор с искусственными мутациями.

С-показатели сильно коррелируют с аллельными разнообразие, патогенность как кодирующих, так и некодирующих вариантов, а также экспериментально измеренные регуляторные эффекты, а также высокоранговые каузальные варианты внутри отдельных последовательностей генома.

Наконец, C-баллы сложных ассоциированные с признаками варианты из полногеномных ассоциативных исследований (GWAS) значительно выше, чем в контрольной группе, и коррелируют с размером выборки исследования, вероятно, отражает повышенную точность более крупных GWAS.

CADD может количественно определять приоритеты функциональных, вредных и причинных заболеваний. вариантов в широком диапазоне функциональных категорий, размеров эффекта и генетических архитектуры и могут быть использованы для определения приоритетов причинно-следственных вариаций в как в исследованиях, так и в клинических условиях.

Помимо этого веб-сайта, CADD описан в трех публикациях. В самой последней рукописи описывается CADD-Splice (CADD v1.6), последнее расширение CADD, чтобы улучшить предсказания эффектов сплайсинга:

Ренцш П., Шубах М., Шендуре Дж., Кирхер М.
CADD-Splice — улучшение предсказания эффекта варианта в масштабе всего генома с использованием оценок сплайсинга, полученных с помощью глубокого обучения.
Геном Мед. 2021 г., 22 февраля. doi: 10.1186/s13073-021-00835-9.
PubMed PMID: 33618777.

Наша вторая рукопись описывает обновления между первоначальной публикацией и CADD v1.4, представляет CADD для GRCh48. и объясняет, как мы представляем себе использование CADD. Он был опубликован Nucleic Acids Research в 2018 году:

Ренцш П., Виттен Д., Купер Г.М., Шендур Дж., Кирхер М.
CADD: прогнозирование вредоносности вариантов во всем геноме человека.
Рез. нуклеиновых кислот. 2018 29 октября. doi: 10.1093/nar/gky1016.
PubMed PMID: 30371827.

Оригинальная рукопись с описанием метода была опубликована Nature Genetics в 2014 году:

Kircher M, Witten DM, Jain P, O’Roak BJ, Cooper GM, Shendure J.
Общая схема оценки относительной патогенности генетических вариантов человека.
Нат Жене. 2 февраля 2014 г. doi: 10.1038/ng.2892.
PubMed PMID: 24487276.

Оценки CADD находятся в свободном доступе для всех некоммерческих приложений. Если вы планируете использовать их в коммерческом приложении, вы можете получить лицензию через систему лицензирования UW CoMotion Express. Если вы сомневаетесь, нужна ли вам лицензия для вашего приложения, свяжитесь с Джей Шендур и Грегори М. Купер. В настоящее время CADD разрабатывается Мартином Кирхером, Филиппом Ренцшем, Даниэлой М. Виттен, Грегори М. Купером и Джеем Шендуром.

У нас есть предварительно рассчитанные баллы на основе CADD (C-баллы) для всех примерно 9 миллиардов возможных однонуклеотидных вариантов (SNV) эталонный геном, подборка коротких вставок/делеций, а также несколько больших наборов вариантов (например, gnomAD, ExAC, 1000 геномов, ESP). Мы также предоставляем простой поиск SNV. и включить оценку коротких вставок/удалений. Диапазоны оценок могут быть визуализированы нативно в UCSC Genome Browser или используя наши пользовательские треки (для hg19/GRCh47 и hg38/GRCh48).

CADD — комбинированная аннотация, зависящая от истощения

Оценки CADD находятся в свободном доступе для всех некоммерческих приложений. Если ты планируете использовать их в коммерческих целях, пожалуйста, получите лицензию. Если у вас есть вопросы, пожалуйста свяжитесь с нами.

Из-за больших размеров файлов мы настоятельно рекомендуем использовать менеджер закачек или другой инструмент, позволяющий продолжить прерванную загрузку (например, wget -c). Обратите внимание, что последние версии также имеют отдельный вариант загрузки через сценарий установки.

Автономные скрипты оценки для v1.6

Сценарии и README для автономной установки файл (360K)

Сборка генома GRCh48/hg38

Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh48/hg38 США | DE (81G) США | ДЭ (2,6 млн)
Все возможные СНВ ГРЧ48/хг38 вкл. все аннотации США | DE (313G) США | Германия (2,7 м)
Все gnomad версии 3.0 InDels для запуска локальной установки США | DE (1.1G) США | DE (1,8 м)
Все версии gnomad 3.0 InDels, вкл. все аннотации для запуска локальной установки США | Немецкий (7,2 г) США | Германия (2,5 м)
Все версии gnomad 3.0 SNV США | DE (5.9G) США | DE (2,4 м)
MD5Sums США | DE
Все аннотации GRCh48, необходимые для автономной установки США | DE (206G)

Сборка генома GRCh47/hg19

Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh47/hg19 США | DE (78G) США | DE (2,6 м)
Все возможные SNV GRCh47/hg19 вкл.
все аннотации
США | DE (248G) США | DE (2,6 м)
48M InDels для запуска локальной установки США | DE (591M) США | DE (1,7 м)
48M InDels вкл. все аннотации для запуска локальной установки США | DE (3,5G) США | DE (2,4 м)
Все SNV gnomAD (версия 2.1.1) США | DE (2.3G) США | Германия (2,0 м)
Все InDels gnomAD (версия 2.1.1) США | DE (387M) США | DE (1,6 м)
MD5Sums США | DE
Все аннотации GRCh47, необходимые для автономной установки США | DE (129G)

Автономные сценарии оценки для версий 1.

4 и 1.5
Сценарии и README для автономной установки файл (360K)

Сборка генома GRCh48/hg38

Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh48/hg38 США | DE (80G) США | Германия (2,7 м)
Все возможные СНВ ГРЧ48/хг38 вкл. все аннотации США | DE (292G) США | ДЭ (2,7М)
80M InDels для запуска локальной установки США | DE (948M) США | DE (1,8 м)
80M InDels вкл. все аннотации для запуска локальной установки США | DE (6,8G) США | DE (2,4 м)
Все варианты BRAVO/TOPMed (заморозка 5) США | DE (5,5G) США | DE (2,4 м)
MD5Sums США | DE
Все аннотации, необходимые для автономной установки США | DE (168G)

Сборка генома GRCh47 / hg19

Новая модель не создана, используйте CADD v1. 4 для GRCh47.

Сборка генома GRCh48/hg38

Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh48/hg38 США | DE (79G) США | Германия (2,7 м)
Все возможные СНВ ГРЧ48/хг38 вкл. все аннотации
США | DE (323G)
США | Германия (2,7 м)
80M InDels для запуска локальной установки США | DE (948M) США | DE (1,8 м)
80M InDels вкл. все аннотации для запуска локальной установки США | DE (8,8 г) США | Германия (2,5 м)
Все варианты BRAVO/TOPMed (заморозка 5) США | DE (5,5G) США | DE (2,4 м)
MD5Sums США | DE
Все аннотации GRCh48, необходимые для автономной установки США | DE (194G)

Сборка генома GRCh47/hg19

Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh47/hg19 США | DE (78G) США | DE (2,6 м)
Все возможные SNV GRCh47/hg19 вкл. все аннотации США | ДЭ (231Г) США | DE (2,6 м)
48M InDels для запуска локальной установки США | DE (588M) США | DE (1,6 м)
48M InDels вкл. все аннотации для запуска локальной установки США | DE (3.3G) США | DE (2,2 м)
Все варианты gnomAD (выпуск 2.0.1) США | DE (2,7G) США | DE (2,1 м)
MD5Sums США | DE
Все аннотации GRCh47, необходимые для автономной установки США | DE (98G)
Описание Ссылка (Размер) Индекс Tabix (размер)
1000 вариантов генома фазы 3 (SNV и InDels) США | DE (885M) США | DE (1,8 м)
1000 вариантов генома фазы 3 (SNV и InDels), вкл. все аннотации США | DE (6.1G) США | Германия (2,5 м)
1000 вариантов генома (SNV и InDels) США | DE (450M) США | DE (1,6 м)
1000 вариантов генома (SNV и InDels), в т.ч. все аннотации США | DE (3.3G) США | DE (2,4 м)
Варианты ESP6500 (SNV и InDels) США | DE (22M) США | DE (524K)
Варианты ESP6500 (SNV и InDels), вкл. все аннотации США | DE (224M) США | DE (632K)
Варианты консорциума агрегации экзома (r0.3) США | DE (108M) США | DE (592K)
Варианты Exome Aggregation Consortium (r0.3) вкл. аннотация США | DE (954M) США | DE (811K)
Варианты SNV на чипе Illumina Exome BeadChip США | DE (2,6 м) США | DE (408K)
Варианты SNV на чипе Illumina Exome BeadChip США | DE (33M) США | DE (476K)
Все возможные SNV GRCh47/hg19 США | DE (80G) США | Германия (2,7 м)
Все возможные SNV GRCh47/hg19 вкл. все аннотации США | DE (344G) США | Германия (2,7 м)
20M InDels для запуска локальной установки США | DE (268M) США | DE (1,6 м)
20M InDels вкл. все аннотации для запуска локальной установки США | DE (1,6 г) США | DE (2,3 м)
Все дорожки аннотаций, необходимые для автономной установки v1.3 США | DE (206G)
Обновление данных WGA приматов, необходимых для автономной установки v1.3 США | DE (3.1G)
Сценарии и README для автономной установки США | DE (132K)
MD5Sums США | DE
Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh47/hg19 США | DE (79G) США | Германия (2,7 м)
Все возможные SNV GRCh47/hg19 вкл. все аннотации США | DE (342G) США | Германия (2,7 м)
1000 вариантов генома (SNV и InDels) США | DE (449M) США | DE (1,7 м)
1000 вариантов генома (SNV и InDels), в т.ч. все аннотации США | Немецкий (3,3G) США | DE (2,4 м)
Варианты ESP6500 (SNV и InDels) США | DE (22M) США | DE (532K)
Варианты ESP6500 (SNV и InDels), вкл. все аннотации США | DE (224M) США | Германия (650K)
Варианты консорциума агрегации экзома (r0.2) США | ДЭ (108М) США | DE (609K)
Варианты Exome Aggregation Consortium (r0.2) вкл. аннотация США | DE (954M) США | DE (811K)
Варианты SNV на чипе Illumina Exome BeadChip США | DE (2,6 м) США | DE (418K)
Варианты SNV на чипе Illumina Exome BeadChip США | ДЭ (33М) США | DE (493K)
20M InDels для запуска локальной установки США | DE (267M) США | DE (1,6 м)
20M InDels вкл. все аннотации для запуска локальной установки США | DE (1,6 г) США | DE (2,3 м)
Все дорожки аннотаций, необходимые для автономной установки США | ДЭ (206Г)
Сценарии и README для автономной установки США | DE (132K)
MD5Sums США | DE
Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh47/hg19 США | DE (80G) США | Германия (2,7 м)
Все возможные СНВ ГРЧ47/hg19 вкл. все аннотации США | DE (279G) США | Германия (2,7 м)
1000 вариантов генома (SNV и InDels) США | DE (449M) США | DE (1,6 м)
1000 вариантов генома (SNV и InDels), в т. ч. все аннотации США | DE (3.3G) США | ДЭ (2,4М)
Варианты ESP6500 (SNV и InDels) США | DE (22M) США | DE (524K)
Варианты ESP6500 (SNV и InDels), вкл. все аннотации США | DE (224M) США | Германия (628K)
Варианты консорциума агрегации экзома (r0.1) США | DE (111M) США | Германия (592K)
Варианты Exome Aggregation Consortium (r0.1), вкл. аннотация США | DE (955M) США | Германия (800K)
Варианты SNV на чипе Illumina Exome BeadChip США | DE (2,6 м) США | DE (408K)
Варианты SNV на чипе Illumina Exome BeadChip США | DE (33M) США | Германия (476K)
14M InDels для запуска локальной установки США | DE (194M) США | DE (1,6 м)
14M InDels вкл. все аннотации для запуска локальной установки США | DE (1.1G) США | DE (2,1 м)
Все дорожки аннотаций, необходимые для автономной установки США | DE (206G)
Сценарии и README для автономной установки США | DE (132K)
MD5Sums США | DE
Описание Ссылка (Размер) Индекс Tabix (размер)
Все возможные SNV GRCh47/hg19 США | DE (79G) США | Германия (2,7 м)
Все возможные SNV GRCh47/hg19 вкл. все аннотации США | DE (218G) США | Германия (2,7 м)
1000 вариантов генома (SNV и InDels) США | DE (445M) США | DE (1,7 м)
Варианты ESP6500 (SNV и InDels) США | DE (22M) США | DE (643K)
Варианты консорциума агрегации экзома (r0.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *