Содержание

Генетический риск развития тромбофилии (расширенный)

Комплексный генетический анализ, который позволяет определить риск тромбофилии. Он представляет собой молекулярно-генетическое исследование генов факторов свертываемости крови, тромбоцитарных рецепторов, фибринолиза, обмена фолиевой кислоты, изменение активности которых напрямую или опосредованно обуславливает склонность к повышенному тромбообразованию.

Какой биоматериал можно использовать для исследования?

Буккальный (щечный) эпителий, венозную кровь.

Как правильно подготовиться к исследованию?

Подготовки не требуется.

Подробнее об исследовании

В результате различных патологических процессов в сосудах могут образоваться тромбы, которые блокируют кровоток. Это самое частое и неблагоприятное проявление наследственной тромбофилии – повышенной склонности к тромбообразованию, связанной с определенными генетическими дефектами. Она может приводить к развитию артериальных и венозных тромбозов, которые в свою очередь зачастую являются причиной инфаркта миокарда, ишемической болезни сердца, инсульта, тромбоэмболии легочной артерии и др.

В систему гемостаза входят факторы свертывающей и противосвертывающей систем крови. В нормальном состоянии они находятся в равновесии и обеспечивают физиологические свойства крови, не допуская повышенного тромбообразования или, наоборот, кровоточивости. Но при воздействии внешних или внутренних факторов это равновесие может нарушаться.

В развитии наследственной тромбофилии, как правило, принимают участие гены факторов свертывания крови и фибринолиза, а также гены ферментов, контролирующих обмен фолиевой кислоты. Нарушения в этом обмене могут привести к тромботическим и атеросклеротическим поражениям сосудов (через повышение уровня гомоцистеина в крови).

Наиболее значимым нарушением, ведущим к тромбофилии, является мутация в гене фактора свертываемости 5 (F5), ее еще называют Лейденской. Она проявляется устойчивостью фактора 5 к активированному протеину С и увеличением скорости образования тромбина, в результате чего и происходит усиление процессов свертываемости крови. Также важную роль в развитии тромбофилии играет мутация в гене протромбина (F2), связанная с повышением уровня синтеза данного фактора свертываемости. При наличии этих мутаций риск тромбозов значительно возрастает, особенно за счет провоцирующих факторов: приема оральных контрацептивов, избыточного веса, гиподинамии и т. д.

У носительниц таких мутаций высока вероятность неблагоприятного течения беременности, например невынашивания беременности, задержки внутриутробного развития плода.

Предрасположенность к тромбозам может быть также обусловлена мутацией гена FGB, кодирующего бета-субъединицу фибриногена (генетический маркер FGB (-455GA). Результатом является повышение синтеза фибриногена, вследствие чего возрастает риск периферического и коронарного тромбоза, риск тромбоэмболических осложнений во время беременности, при родах и в послеродовом периоде.

Среди факторов, повышающих риск развития тромбоза, очень важны гены тромбоцитарных рецепторов. В данном исследовании проводится анализ генетического маркера гена тромбоцитарного рецептора к коллагену (ITGA2 807 C>T) и фибриногену (ITGB3 1565T>C). При дефекте гена рецептора к коллагену усиливается прилипание тромбоцитов к эндотелию сосудов и к друг к другу, что ведет к повышенному тромбообразованию. При анализе генетического маркера ITGB3 1565T>C возможно выявить эффективность или неэффективность антиагрегантной терапии аспирином. При нарушениях, обусловленных мутациями в этих генах, повышается риск тромбозов, инфаркта миокарда, ишемического инсульта.

С тромбофилией могут быть связаны не только нарушения свертывающей системы крови, но и мутации генов фибринолитической системы. Генетический маркер SERPINE1 (-675 5G>4G) – ингибитор активатора плазминогена – основного компонента антисвертывающей системы крови. Неблагоприятный вариант этого маркера приводит к ослаблению фибринолитической активности крови и, как следствие, повышает риск сосудистых осложнений, различных тромбоэмболий.  Мутация гена SERPINE1 также отмечается при некоторых осложнениях беременности (невынашивание беременности, задержка развития плода).

Кроме мутаций факторов свертывающей и противосвертывающей систем, как значимую причину тромбофилии рассматривают повышенный уровень гомоцистеина. При чрезмерном накоплении он оказывает токсическое действие на эндотелий сосудов, поражает сосудистую стенку. В месте повреждения образуются тромбы, там же может осесть избыточный холестерин. Эти процессы приводят к закупориванию сосудов. Избыточное содержание гомоцистеина (гипергомоцистеинемия) увеличивает вероятность развития тромбозов в кровеносных сосудах (как в артериях, так и в венах). Одной из причин повышения уровня гомоцистеина является снижение активности ферментов, обеспечивающих его обмен (в исследование включен ген MTHFR). Помимо генетического риска развития гипергомоцистеинемии и ассоциированных с ней заболеваний, наличие изменений в данном гене позволяет определить предрасположенность и к неблагоприятному течению беременности (фетоплацентарной недостаточности, незаращению нервной трубки и другим осложнениям для плода). При изменениях в фолатном цикле в качестве профилактики назначаются фолиевая кислота и витамины В6, В12. Продолжительность терапии и дозировка препаратов может определяться на основании генотипа, уровня гомоцистеина и особенностей сопутствующих факторов риска у пациента.

Заподозрить наследственную предрасположенность к тромбофилии возможно при семейной и/или личной истории тромботических заболеваний (тромбоз глубоких вен, варикозная болезнь и др.) и также в акушерской практике – при тромбоэмболических осложнениях у женщин во время беременности, в послеродовом периоде.

Комплексное молекулярно-генетическое исследование позволяет оценить генетический риск тробофилии. Зная о генетической предрасположенности можно предотвратить своевременными профилактическими мероприятиями развитие сердечно-сосудистых нарушений..

Факторы риска развития тромбофилии:

  • постельный режим (более 3 суток), длительная иммобилизация, долгие статические нагрузки, в том числе связанные с работой, малоподвижный образ жизни;
  • применение пероральных контрацептивов, содержащих эстрогены;
  • избыточная масса тела;
  • венозные тромбоэмболические осложнения в анамнезе;
  • катетер в центральной вене;
  • обезвоживание;
  • хирургические вмешательства;
  • травма;
  • курение;
  • онкологические заболевания;
  • беременность;
  • сопутствующие сердечно-сосудистые заболевания, злокачественные новообразования.

Когда назначается исследование?

  • При наличии тромбоэмболии в семейном анамнезе.
  • При наличии тромбоза в анамнезе.
  • При тромбозе в возрасте до 50 лет, повторных тромбозах.
  • В случае тромбоза в любом возрасте в сочетании с отягощенным семейным анамнезом по тромбоэмболии (тромбоэмболия лёгочной артерии), в том числе при тромбозах других локализаций (сосудов мозга, портальных вен).
  • При тромбозе без очевидных факторов риска в возрасте старше 50 лет.
  • В случае применения гормональных контрацептивов или заместительной гормональной терапии у женщин: 1) имеющих тромбозы в анамнезе, 2) у родственников 1-й степени родства которых были тромбозы или наследственная тромбофилия.
  • При осложненном акушерском анамнезе (невынашивании беременности, фетоплацентарной недостаточности, тромбозах во время беременности и в раннем послеродовом периоде и др.).
  • При планировании беременности женщинами, страдающими тромбозами (или в случае тромбоза у их родственников 1-й степени родства).
  • При таких условиях высокого риска, как полостные оперативные вмешательства, длительная иммобилизация, постоянные статические нагрузки, малоподвижный образ жизни.
  • При сердечно-сосудистых заболеваниях в семейном анамнезе (случаи ранних инфарктов и инсультов).
  • При оценке риска тромботических осложнений у больных со злокачественными новообразованиями.

Что означают результаты?

По результатам комплексного исследования 10 значимых генетических маркеров выдается заключение врача-генетика, которое позволит оценить риск тромбофилии, спрогнозировать развитие таких заболеваний как тромбоз, тромбоэмболия, инфаркт, или вероятность осложнений, связанных с нарушением гемостаза,  при беременности, выбрать направления оптимальной профилактики, а при уже имеющихся клинических проявлениях детально разобраться в их причинах.

Определение генетического полиморфизма в геноме человека
























Определение полиморфизма в геноме человека (формат PCRRT)

Определение генетического полиморфизма предрасположенности к артериальной гипертензии 

 

Комплексное генетическое исследование, которое позволяет спрогнозировать риск гипертонии и связанных с ней заболеваний, выявить патологию на ранних сроках. Также оно помогает разобраться в причинах уже имеющейся патологии, выбрать направления оптимальной профилактики и персональной медикаментозной терапии. В анализ включены основные генетические маркеры, участвующие в регуляции артериального давления.

Определение генетического полиморфизма предрасположенности к тромбообразованию

 

Комплексный генетический анализ, который позволяет определить риск тромбофилии. Он представляет собой молекулярно-генетическое исследование генов факторов свертываемости крови, тромбоцитарных рецепторов, фибринолиза, обмена фолиевой кислоты, изменение активности которых напрямую или опосредованно обуславливает склонность к повышенному тромбообразованию.

Определение генетического полиморфизма предрасположенности к нарушениям метаболизма фолатного цикла

 

Комплексное генетическое исследование, которое позволяет определить риск сердечно-сосудистых заболеваний, а также патологии развития плода, связанных с нарушением обмена фолиевой кислоты и гипергомоцистеинемией. Анализ включает в себя молекулярно-генетическое исследование генов ферментов, изменение активности которых приводит к повышению уровня гомоцистеина в крови.

Определение фармакогенетических маркеров метаболизма лекарственных препаратов

 

Фармакогенетическое исследование, направленное на определение индивидуальной безопасной дозы препарата варфарина (антикоагулянта непрямого действия). Проводится анализ на наличие мутаций по трем генетическим маркерам, связанным с повышенной чувствительностью к варфарину. Выявление оптимальной дозы варфарина позволяет сократить срок подбора его дозы, а также снизить риск геморрагических осложнений.

Генетическое исследование, которое позволяет определить эффективность применения препарата «Клопидогрел» на основании активности фермента CYP2C19.

 

Определение генетического полиморфизма предрасположенности к раку молочной железы (BRCA ½)

 

Генетическое комплексное исследование, которое позволяет определить наследственную предрасположенность к раку молочной железы и яичников. Оно представляет собой анализ наиболее распространенных генетических маркеров (85 % среди всех наследственных форм рака молочной железы и яичников), наличие которых указывает на повышенный риск развития онкологического заболевания.

Определение генетического полиморфизма предрасположенности к первичной лактазной недостаточности

 

Лактозная непереносимость связана с генетически обусловленным снижением активности лактазы (фермента, необходимого для усвоения лактозы) и проявляется неспецифическими симптомами, развивающимися после потребления продуктов, содержащих молочный сахар. Возникает после периода грудного вскармливания.

Определение генетического полиморфизма интерлейкина ILВ28

 

Это прогностическое тестирование, дающее возможность оценить успешность (вероятность успешности) курса лечения хронического гепатита С. Исследованию подлежат генетические полиморфизмы гена IL28B расположенные в локусах rs12979860/ rs8099917.

Определение генетического полиморфизма компонентов  главного комплекса гистосовместимости человека HLA

 

Выявление гена гистосовместимости HLA-B27. Определение предрасположенности к развитию спондилоартропатий (в т.ч. анкилозирующего спондилита — болезнь Бехтерева)

 

Комплексное исследование, определяющее генетическую гистосовместимость партнеров. Различие супругов по вариантам генов HLA считается одним из важных условий успешного наступления и вынашивания беременности. Сходство супругов между собой по вариантам генов HLA ведет к повышению вероятности появления плода с двойным набором одинаковых вариантов генов, то есть HLA-гомозигот, или полному совпадению плода и матери по HLA генотипу, что является неблагоприятным фактором, следствием чего могут стать репродуктивные потери. В связи с этим, HLA-типирование используют для диагностики причин невынашивания беременности и бесплодия. При репродуктивных нарушениях важно количество совпадений вариантов генов HLA II класса у супругов: чем их меньше, тем выше вероятность наступления беременности. Генотипирование HLA класса II включает в себя определение конкретных вариантов генов из всех возможных. В исследование включено 3 локуса гена HLA: HLA-DRB1, HLA-DQA1 и HLA-DQB1.

Определение генетических факторов мужского бесплодия

 

Комплексное исследование, которое позволяет определить ведущие генетические причины мужского бесплодия и выбрать соответствующую тактику лечения пациента.

В исследование включено выявление делеций в области локуса AZF, влияющих на сперматогенез, и определение количества CAG-повторов в гене AR, связанных с изменением чувствительности к андрогенам.

Определение генетики плода

 

Определение гена резус-фактора плода в крови матери

Анализы в KDL. Генетический риск нарушений системы свертывания

Данное исследование представляет собой выявление полиморфизмов в генах, связанных с наследственной тромбофилией и другими нарушениями системы свертывания крови. Тромбофилия – это повышенная склонность к случайному (без видимых причин) тромбозу глубоких вен и тромбоэмболическим осложнениям. Тромбоз может возникнуть при нарушениях кровообращения (застой крови), повышенной способности крови образовывать тромбы (гиперкоагуляции), повреждениях сосудистой стенки и при сочетании этих факторов. Гиперкоагуляция может быть обусловлена наличием генетической предрасположенности к тромбофилии (наиболее часто встречаются полиморфизмы в генах F2 и F5), которую позволяет выявить этот анализ.

В каких случаях обычно назначают исследование?

Анализ рекомендован следующим категориям пациентов:

  • пациенты с семейной историей тромбофилии и других венозных осложнений
  • пациенты с наличием в семейной истории сердечно- сосудистых событий (инфарктов и инсультов) у близких родственников в возрасте до 50 лет
  • женщины, планирующие прием комбинированных
  • пациенты с тромбозами любой локализации в возрасте до 50 лет, даже при наличии предрасполагающих факторов
  • пациенты с тромбозами необычных мест (тромбоз мозговых синусов, мезентериальные, печеночные вены)
  • пациенты с хроническими заболеваниями вен, в частности с тромбофлебитами
  • женщины, планирующие прием комбинированных оральных контрацептивов
  • женщины, планирующие гормональную заместительную терапию
  • женщины с привычным невынашиванием беременности.

Что именно определяется в процессе анализа?

В данном исследовании выявляются полиморфизмы следующих генов:

  • F2 — ген протромбина.
  • F5 – ген фактора V свертывания крови.
  • F7 – ген проконвертина.
  • F13A1 – ген, кодирующий A-субъединицу XIII фактора свертывания.
  • FGB – ген, кодирующий бета- субъединицу фибриногена.
  • ITGA2 – ген, кодирующий тромбоцитарный гликопротеин Iа.
  • ITGB3 – ген, кодирующий белок интегрин бета- 3, являющийся компонентом тромбоцитарного гликопротеина IIb/IIIа.
  • SERPINE1 (PAI-I)– ген ингибитора активатора плазминогена 1 типа.

Что означают результаты теста?

В качестве заключения выдается генетическая карта здоровья, составленная профессиональным врачом-генетиком нашей лаборатории. В ней представлены результаты анализа с расшифровкой, дано подробное описание исследуемых полиморфизмов и их влияния на риски развития нарушений системы свертывания крови, сердечно-сосудистых заболеваний и патологий беременности, советы по проведению дополнительных исследований и подробные клинические рекомендации для лечащего врача.

Результаты анализа интерпретируются лечащим врачом. Опираясь на них, врач может скорректировать питание и образ жизни пациента, назначить лекарственные препараты и дополнительные исследования.

Сроки выполнения теста.

Результат генетического исследования можно получить спустя 10-11 дней после взятия крови.

Как подготовиться к анализу?

Следует придерживаться общих правил подготовки к взятию крови из вены. Кровь можно сдавать не ранее, чем через 3 часа после приема пищи в течение дня, или утром натощак. Чистую воду можно пить в обычном режиме.

Наследственная тромбофилия

Склонность к патологическому свертыванию крови, или тромбофилия может обнаруживаться у пациентов, столкнувшихся с опасным состоянием — тромбозом 1. И у многих из них склонность к повышенному тромбообразованию передалась по наследству. Почему развивается наследственная тромбофилия. Какие симптомы появляются при данном состоянии, как ее диагностировать и лечить?

Генетические факторы

Тромбофилия, которая передается по наследству, — генетически обусловленная склонность к формированию тромбов. При сочетании двух и более нарушений в системе свертывания выраженные тромботические расстройства могут развиваться уже в раннем детстве. Однако чаще наследственное повышение свертываемости крови вызвано одним нарушением, которое выявляется случайно при лабораторном исследовании крови 2.

Выделяют два основных типа тромбофилий: гематогенные, связанные с изменениями свертывающей системы крови, и негематогенные. На сегодня известны как минимум 20 генетических факторов, связанных с развитием заболевания. Их разделяют на три группы2:

  1. Установленные:

    • фактор V Лейден — мутация, при которой из-за замены аминокислот в белковой цепи V фактора свертывания он становится устойчивым к действию одного из основных противосвертывающих агентов, активированного протеина С.
    • Мутация G20210А протромбина II, при которой изменяется уровень фактора свертывания крови II протромбина.
    • Дефицит протеина С, инактивирующего факторы свертывания крови Va и VIIIa. Встречается реже, чем две предыдущие мутации, обычно приводит к развитию семейного венозного тромбоза.
    • Дефицит протеина S — кофактора протеина С, который усиливает его противосвертывающую и фибринолитическую активность.
    • • Дефицит антитромбина, основного белкового фактора, который угнетает свертывание крови. Передается по аутосомно-доминантному типу, то есть проявляется только при наличии хотя бы одного дефектного гена.
  2. Неопределённые:

    • Дисфибриногенемия — состояние, при котором содержание фибриногена соответствует норме, однако сама молекула фибриногена изменена. Чаще передается по аутосомному типу наследования, то есть для проявления заболевания дефектный ген должен передаться от обоих родителей. Обычно проявляется умеренными кровотечениями на фоне травмы или хирургического вмешательства.
    • Гипергомоцистеинемия. Может быть одновременно и наследственным, и приобретенным нарушением 2. Связана с редкими генетическими поломками, которые приводят к повышению концентрации гомоцистеина в моче, плазме крови. Гомоцистеин проявляет выраженный токсический эффект, повреждая внутреннюю поверхность сосудов, значительно увеличивая риск тромбозов.
  3. Редкие.

    К редким факторам тромбофилии относятся повышение концентрации факторов свертывания крови VIII, IX, XI, VII, XII, дефицит плазминогена, активация тканевого плазминогена, повышение липопротеина А, полиморфизм гликопротеина тромбоцитов, дефект гена тромбомодулина, другие факторы.

Как проявляется тромбофилия?

Наличие тромбофилии можно заподозрить при следующих состояниях 2:

  • Повторная венозная тромбоэмболия
  • Венозный тромбоз в возрасте младше 40 лет
  • Венозная тромбоэмболия у родственников
  • Тромбоз необычной локализации, например, брыжеечной вены, почечной вены, печени, церебральный тромбоз.

Необходимо отметить, что чаще всего тромбофилия приводит к тромбозу вен, однако недостаточность протеинов С, S и антитромбина могут проявляться также тромбозами в артериях. Последние становятся причиной инфаркта миокарда и острого нарушения мозгового кровообращения — инсульта.

Диагностика тромбофилии

Своевременная диагностика генетической (наследственной) тромбофилии играет важную роль в прогнозе заболевания. Раннее выявление заболевания позволяет внести необходимые коррективы в образ жизни и таким образом предупредить патологическое тромбообразование.

Поскольку передающаяся по наследству тромбофилия может быть связана с различными генетическими факторами, диагностика ее носит комплексный характер. Задача врача — подтвердить или опровергнуть наличие мутаций, связанных с нарушением свертывающей активности крови.

К числу анализов, которые придется сдать при подозрениях на наследственную тромбофилию, относятся3:

Развернутая коагулограмма с определением уровня факторов свертывания крови, физиологических антикоагулянтов.

Коагулограмма позволяет выявить отклонения в системе гемостаза и определить тип тромбофилии, недостаточность каких именно факторов свертываемости наблюдается.

  • Определение уровня гомоцистеина, позволяющее диагностировать гипергомоцистеинемию.
  • Определение содержания тромбомодулина, активности фактора Виллебранда, а также концентрации эндотелина-1, необходимые для получения информации о возможном поражении сосудов вследствие тромбофилии.
  • Генетическое исследование полиморфизма генов тех факторов, которые участвуют в гемостазе.

Наследственная тромбофилия и беременность

Связь между передаваемыми по наследству тромбофилиями и осложнениями беременности, например, преэклампсией, эклампсией, самопроизвольным прерыванием беременности, задержкой развития плода, отслойкой плаценты до сих пор остается противоречивой4. И тем не менее, некоторые акушерские осложнения все же вызваны тромбофилиями.

Так, ряд исследований свидетельствует о возможной связи между потерей плода во втором и третьем триместрах беременности с наличием наследственной тромбофилии6. Это объясняется нарушением кровообращения в сосудах плаценты вследствие формирования в ней тромбов. Однако важно подчеркнуть, что самопроизвольные потери плода на ранних сроках беременности (в первом триместре) чаще не имеют отношения к тромбофилии.

Тем не менее, наличие тромбофилии, которая заложена генетически, у беременных женщин может повышать риск венозных тромбоэмболических осложнений5. Даже в норме, у здоровых женщин во время беременности свертывающая система крови активируется: наблюдается физиологическая гиперкоагуляция (повышение свертываемости крови), также имеется венозный застой. Однако, у беременных женщин, страдающих тромбофилией, коагуляция еще более увеличивается, что и может приводить к повышению риска тромбообразования, прежде всего в венозных сосудах7.

Формированию венозного застоя у будущих мам может способствовать и снижение физической активности, например, при некоторых осложнениях беременности, а также после кесарева сечения 7.

Диагностика тромбофилии при беременности затруднена, поскольку ряд показателей повышается как при патологии, так и у здоровых женщин, причем чем больше срок беременности, тем выше риск тромбоза. Чтобы поставить диагноз, прибегают к генетическому исследованию, которое обычно проводится по рекомендации лечащего врача при наличии определенных показаний, например, при наличии перенесенного венозного тромбоза нижних конечностей или наличии венозных тромбозов у близких родственников.

Профилактика тромбозов

Профилактика тромбозов при тромбофилии в большинстве случаев основана на изменении образа жизни. Пациентам рекомендуют избегать тяжелых физических нагрузок и травм, при этом сохраняя прежний объем физической активности. Важная мера профилактики — ношение компрессионного трикотажа. Врачи всегда принимают решение о профилактических мерах строго индивидуально после оценки тромботического риска.

Список литературы
  1. Kyrle P.A., Rosendaal F.R., Eichinger S. Risk assessment for recurrent venous thrombosis //Elsevier.2010;376(9757):2032–2039.
  2. Khan S., Dickerman J.D. Hereditary thrombophilia. // Thromb. J. BioMed Central. 2006;4:15.
  3. Васильев С.А., Виноградов В.Л., и соавт. Тромбозы и тромбофилии: классификация, диагностика, лечение, профилактика // РМЖ — 2013.- № 17. — С.896.
  4. Robertson L. et al. Thrombophilia in pregnancy: a systematic review // Br. J. Haematol. Blackwell Science Ltd.2006;132(2):171–196.
  5. Sibai B.M., How H.Y., Stella C.L. Thrombophilia in pregnancy: Whom to screen, when to treat. 2007;19(1):50–64.
  6. Battinelli E.M., Marshall A., Connors J.M. The role of thrombophilia in pregnancy. // Thrombosis. Hindawi.2013; 2013:516420.
  7. Андрияшкин А.В. Российские клинические рекомендации по диагностике, лечению и профилактике венозных тромбоэмболических осложнений // Флебология — 2015. –Т. 9. – № 2. –С.1–52.

SARU.ENO.19.03.0436

Сдать анализ на гены системы гемостаза (с описанием результатов врачом- генетиком)

Метод определения
Real-time-PCR.

Исследуемый материал
Цельная кровь (с ЭДТА)

Доступен выезд на дом

Расширенное исследование генов системы гемостаза: F2, F5, MTHFR, MTR, MTRR, F13, FGB, ITGA2, ITGВ3, F7, PAI-1

Комплексное исследование генетических факторов риска развития нарушений в системе свертывания крови и фолатном цикле.

 

Различные изменения в генах системы гемостаза и цикла обмена фолатов предрасполагают к развитию большого числа патологических состояний: инфаркты, инсульты, тромбоэмболии, кровотечения, патология беременности и родов, осложнения послеоперационного периода и т.д. 

Профиль включает в себя исследование основных полиморфизмов в генах системы гемостаза и фолатного цикла: 

  1. F2 c.*97G>A (20210 G>A; rs1799963),
  2. F5 c.1601G>A (Arg534Gln; 1691 G>A; rs6025),  
  3. MTHFR c.665C>T (Ala222Val; 677 C>T; rs1801133), 
  4. MTHFR c.1286A>C (Glu429Ala; 1298 A>C; rs1801131), 
  5. MTR c.2756A>G (Asp919Gly; rs1805087), 
  6. MTRR c.66A>G (Ile22Met; rs1801394), 
  7. F13 с.103G>T (I63Т; rs5985), 
  8. FGB c.-467G>A (-455 G>А; rs1800790), 
  9. ITGA2 c.759C>T (Phe253Phe, 807 C>T; rs1126643), 
  10. ITGB3 c.176T>C (Leu59Pro; 1565 T>C; rs5918), 
  11. F7 c.1238G>A (Arg353Gln; 10976 G>A; rs6046), 
  12. PAI-1 (SERPINE1) –675 5G>4G (rs1799889). 

Ген F2 кодирует аминокислотную последовательность белка протромбина. Полиморфизм F2 c.*97G>A приводит к повышенной экспрессии гена. Клинически неблагоприятный вариант полиморфизма (c.*97A) наследуется по аутосомно-доминантному типу. Наличие полиморфизма F2 c.*97G>A в гомозиготной или гетерозиготной форме значительно (в 3 и более раз, а на фоне курения — в 40 и более раз) увеличивает риск возникновения венозных тромбозов, в том числе тромбозов сосудов мозга и сердца, особенно в молодом возрасте. У пациентов-носителей данного полиморфизма повышен риск развития тромбоэмболий после хирургических вмешательств. Приём оральных контрацептивов у данной группы лиц также увеличивает риск тромбозов (относительный риск развития тромбофилии и венозной тромбоэмболии у гетерозиготных носительниц полиморфизма c.*97G>A возрастает в 16 раз).

Ген F5 кодирует аминокислотную последовательность белка проакцелерина — коагуляционного фактора 5. Нуклеотидная замена c.1601G>A («мутация Лейден») приводит к аминокислотной замене аргинина на глутамин в позиции 534, что придает устойчивость активной форме проакцелерина. Клинически это проявляется рецидивирующими венозными тромбозами и тромбоэмболиями. Наличие полиморфизма в гомозиготной или гетерозиготной форме значительно (в 3 и более раз, а на фоне заместительной гормонотерапии или приема оральных контрацептивов — в 30 и более раз) увеличивает риск венозных тромбозов. Риск инфаркта миокарда увеличивается в 2 и более раз, риск развития патологии беременности (прерывание беременности, преэклампсия, хроническая плацентарная недостаточность и синдром задержки роста плода) увеличивается в 3 и более раз. 

Также, пациенты, являющиеся одновременно носителями полиморфизма c.*97G>A гена протромбина и «мутации Лейден», еще в большей степени подвержены риску развития тромбозов и тромбоэмболий.

 

Ген MTHFR кодирует аминокислотную последовательность фермента метилентетрагидрофолатредуктазы, играющего ключевую роль в метаболизме фолиевой кислоты. Полиморфизм c.665C>T гена MTHFR связан с заменой нуклеотида цитозина (С) на тимин (Т), что приводит к аминокислотной замене аланина на валин в позиции 222. Вариант c.665Т связан с четырьмя группами мультифакториальных заболеваний: сердечно-сосудистыми, дефектами развития плода, колоректальной аденомой и раком молочной железы и яичников. У женщин с генотипом c.665Т/Т дефицит фолиевой кислоты во время беременности может приводить к порокам развития плода, в том числе незаращению нервной трубки. Неблагоприятное воздействие варианта c.665Т- зависит от внешних факторов: низкого содержания в пище фолатов, курения, приема алкоголя. Сочетание генотипа c.665Т/Т и папилломавирусной инфекции увеличивает риск цервикальной дисплазии. Назначение препаратов фолиевой кислоты может значительно снизить негативное влияние данного варианта полиморфизма. 

Полиморфизм MTHFR c.1286A>C связан с точечной заменой нуклеотида аденина (А) на цитозин (С), что приводит к замене аминокислотного остатка глутаминовой кислоты на аланин в позиции 429, относящейся к регулирующей области молекулы фермента. При наличии данного полиморфизма отмечается снижение активности фермента MTHFR. Это снижение обычно не сопровождается изменением уровня гомоцистеина в плазме крови у носителей дикого варианта полиморфизма c.665C>T, однако сочетание аллельного варианта* c.1286C с аллелем c.665T приводит к снижению уровня фолиевой кислоты и соответствует по своему эффекту гомозиготному состоянию MTHFR c.665Т/T. При этом риск развития дефектов нервной трубки повышается в 2 раза. Жизнеспособность плодов, имеющих одновременно оба полиморфных варианта, также снижена.

 

Ген MTR кодирует аминокислотную последовательность фермента метионин синтазы. Полиморфизм c.2756A>G связан с аминокислотной заменой (аспарагиновой кислоты на глицин) в молекуле фермента. В результате этой замены функциональная активность фермента изменяется, что приводит к повышению риска формирования пороков развития у плода. Влияние полиморфизма усугубляется повышенным уровнем гомоцистеина. 

Ген MTRR кодирует аминокислотную последовательность фермента редуктазы метионинсинтазы. Полиморфизм c.66A>G связан с аминокислотной заменой в молекуле фермента. В результате этой замены функциональная активность фермента снижается, что приводит к повышению риска развития дефектов нервной трубки у плода. Влияние полиморфизма усугубляется дефицитом витамина В12. При сочетании полиморфизма c.66A>G гена MTRR с полиморфизмом c.665C>T в гене MTHFR риск spina bifida увеличивается. Полиморфизм c.66A>G гена MTRR усиливает гипергомоцистеинемию, вызываемую полиморфизмом c.665C>T в гене MTHFR. 

Ген фибриназы (F13) кодирует синтез трансглютаминазы, участвующей в стабилизации фибринового сгустка и в формировании соединительной ткани. Аллельные варианты с.103G/Т и с.103Т/Т приводят к снижению уровня трансглютаминазы с образованием сетчатой структуры фибрина с более тонкими волокнами, меньшими порами, и изменением характеристик проникновения, которое в сочетании с другими факторами риска ассоциируется с возможным риском внутричерепных кровоизлияний и кровотечений из внутренних органов, а также привычным невынашиванием беременности. При этом аллельный вариант с.103Т может выступать в роли протективного фактора в отношении инфаркта миокарда и венозных тромбозов.

Ген FGB кодирует β-цепь фибриногена, являющегося предшественником фибрина. Аллельный вариант c.-467А обусловливает усиленную транскрипцию гена и может приводить к увеличению уровня фибриногена в крови и повышению вероятности образования тромбов при наличии дополнительных факторов риска. Гетерозиготный вариант c.-467G/А связывают с повышенным риском ишемического инсульта и лакунарными инфарктами церебральных сосудов. Гомозиготный вариант c.-467A/А связывают с повышенным риском инфаркта миокарда. 

Ген гликопротеина Gp1a (ITGA2) кодирует синтез альфа-2-субъединицы интегринов – специализированных рецепторов тромбоцитов. Аллельный вариант c.759Т вызывает изменение первичной структуры субъединицы и свойств рецепторов. При гетерозиготном (c.759C/T) варианте отмечается увеличение скорости адгезии тромбоцитов к коллагену I типа, что может приводить к повышенному риску тромбофилии, инфаркта миокарда и других сердечно-сосудистых заболеваний. Аллельный вариант c.759Т связывают со случаями резистентности к аспирину. Помимо этого, при гомозиготном (c.759Т/T) варианте значительно увеличивается количество рецепторов на поверхности тромбоцитов. В совокупности, при гомозиготном варианте данного полиморфизма значительно повышен риск тромбофилии, инфаркта миокарда и развития других острых эпизодов тромбообразования в возрасте до 50 лет, даже по сравнению с гетерозиготным вариантом. 

Ген гликопротеина Gp3a (ITGB3) кодирует синтез бета-3 цепи интегринового комплекса GP2b\3a, участвующего в разнообразных межклеточных взаимодействиях (адгезии и сигнализации). 

Аллельный вариант c.176С (гетерозигота c.176T/C) обусловливает повышенную адгезию тромбоцитов и может приводить к увеличению риска развития острого коронарного синдрома, а также связан с синдромом привычного невынашивания беременности. Гомозиготный вариант c.176С/C обусловливает повышенную адгезию тромбоцитов и может приводить к значительному увеличению риска развития острого коронарного синдрома в возрасте до 50 лет. У лиц с полиморфными аллельными вариантами часто отмечается пониженная эффективность аспирина. 

Аллельный вариант c.1238A (гетерозигота c.1238G/A и гомозигота c.1238А/A) гена F7 приводит к понижению экспрессии гена и снижению уровня фактора 7 в крови, рассматривается как протективный маркёр в отношении развития тромбозов и инфаркта миокарда. 

Ген ингибитора активатора плазминогена (PAI-1) кодирует белок-антагонист тканевого и урокиназного активатора плазминогена. Преобладающим в популяции вариантом исследуемого полиморфизма является гетерозиготный вариант -675 5G/4G. В связи с этим данный полиморфизм самостоятельного диагностического значения не имеет, эффект возможно оценить в сочетании с другими факторами предрасполагающими к развитию патологии (например в сочетании с FGB c.-467A). Аллельный вариант -675 4G сопровождается большей активностью гена, чем -675 5G, что обусловливает более высокую концентрацию PAI-1 и уменьшение активности противосвёртывающей системы. Гомозигота -675 4G/4G ассоциирована с повышением риска тромбообразования, преэклампсии, нарушением функции плаценты и самопроизвольного прерывания беременности.

*Примечание: иногда в научной литературе при описании однонуклеотидных замен, характерных для генных полиморфизмов, встречается термин «мутантный аллель». Это терминологическая неточность, так как в классической генетике термин «мутантный аллель» традиционно рассматривается как синоним термина «мутация». При мутациях, как известно, изменение структуры гена приводит к образованию (экспрессии) нефункциональных белков и к неизбежному развитию наследственного заболевания. При полиморфизмах изменение в структуре гена приводит лишь к появлению белков с немного изменёнными физико-химическими свойствами. Такие изменения, как известно, проявляют себя при воздействии на организм различных факторов внешней среды или при изменении функционального состояния организма человека. И только в таких ситуациях функционирование белков со структурными особенностями может, либо способствовать ускорению развития заболевания, либо, напротив, тормозить формирование патологических процессов. Поэтому, на наш взгляд, для разграничения изменений в генах столь очень похожих структурно, но приводящих к несоизмеримо разным последствиям для организма, корректнее в отношении генных полиморфизмов применять понятие «аллельный вариант гена», а не «мутантный аллель».

Краткий словарь генетических терминов


Краткий словарь основных понятий и терминов, использующихся в генетике

Для понимания того, с чем работает наша компания и зачем эта работа нужна, какие результаты мы получаем и что они вам расскажут, можно прийти на консультацию к специалистам ЦГРМ «ГЕНЕТИКО». А для того, чтобы Вы не забыли, о чем был разговор, и не утонули в море новой информации, мы составили для Вас небольшой словарик основных понятий и терминов, использующихся в генетике.

Основным положением биологической науки является то, что клетка – это самое маленькое из возможных проявление жизни и что новая клетка может появиться только от уже существующей и никак не может возникнуть сама по себе. Конечно, это приводит к большому количеству вопросов о том, как зародилась жизнь и каким образом могла сформироваться самая первая клетка. Но для удобства будем считать обозначенные положения верными в современной реальности планеты Земля, где мы живем. Несмотря на невообразимо огромное разнообразие живых существ, все они состоят из клеток. И у всех клеток есть схожие черты, которые обусловлены самыми простыми жизненными необходимостями. Во-первых, клетка должна как-то отделяться от внешнего пространства – для этого есть специальная оболочка.

Во-вторых, клетка должна питаться – для этого есть разные системы, способные преобразовать энергию света или химических связей в необходимые для жизни вещества и удобную для использования энергию. И еще клетка умеет размножаться. Для выполнения всех этих функций необходимы механизмы, основу которых составляют белки и РНК. А вот инструкция, как эти молекулы должны выглядеть и работать, хранится в специальном отсеке клетки – ядре – в виде ДНК. Ошибки в этой инструкции, которая разрабатывалась миллионы лет, приводят к смерти клетки. А в многоклеточном организме, таком, как у человека, например, клетки взаимодействуют друг с другом, поэтому нарушение в работе одной или нескольких клеток может привести не к смерти всего организма, а к нарушениям его работы – заболеваниям. Также необходимо помнить, что человеческий организм огромная система, ансамбль миллионов разнообразных маленьких организмов, которые выросли из одной единственной клетки – зиготы – результата слияния яйцеклетки и сперматозоида.

ДНК – ДезоксиРибонуклиновая Кислота – полимер, то есть молекула с большим количеством последовательно повторяющихся структурных элементов, который несет всю информацию о генах и белках, необходимых для жизни всего организма. ДНК является картотекой, библиотекой и матрицей, с которой считывается информация в определенной последовательности и определенных условиях, разъяснения о которых записаны как в самой ДНК, так и с помощью различных дополнительных модификаций этой молекулы. Каждой хромосоме соответствует 1 молекула ДНК. Структурными блоками этого полимера являются дезоксирибонуклеотиды (=нуклеотиды), которые бывают 4х видов (А, Т, Г, Ц).

Последовательность ДНК – это то, в каком порядке в молекуле ДНК идут ее структурные элементы – нуклеотиды. Таким образом, генетической информацией является именно последовательность ДНК, а молекула ДНК является ее физическим носителем.

Хромосома – это молекула ДНК, специальным образом обернутая различными белками, которые помогают управляться с такой длинной молекулой, чтобы она не порвалась, не перепуталась с другими ДНК-молекулами и была физически доступна для белков, осуществляющих работу всего генетического аппарата.

РНК –РибоНуклиновая Кислота – полимер, который выполняет функциональную роль переносчика информации, то есть копии, которая делается с ДНК и используется для создания функциональных молекул: специальных РНК или белков. Специальные молекулы РНК могут не являться матрицами, на базе которых синтезируется белок, а сами выполняют структурные, ферментативные или транспортные функции. Главное, что последовательность структурных блоков в молекуле РНК всегда определена последовательностью ДНК соответствующего участка.

Белок – основная функциональная единица живой клетки с самым широчайшим спектром функций и возможностей. Как ДНК и РНК, является полимером, однако имеет химически иные структурные блоки – аминокислоты. Их последовательность, с одной стороны, напрямую зависит от соответствующей последовательности ДНК и может изменяться только в ограниченных и предусмотренных в ДНК инструкций, с другой стороны является основой структуры, в том числе пространственной, возможностей и функции белков разных типов.

Ген – определение гена включает два аспекта: теоретический и физический. Теоретически, то есть умозрительно, геном называют последовательность ДНК (слово, записанное на языке генетики), обладающее определенными свойствами. Как и слово в языке, ген является основой наследственной информации, в то время как различные другие структуры можно отнести к знакам препинания или вспомогательным элементам. Ген является подробной инструкцией для синтеза белка или специфической РНК, которую он кодирует. Причем эта инструкция описывает не только последовательность молекул, но и то в каких условиях и как они должны работать и выполнять свои функции. С физической, то есть материальной, точки зрения, ген – это часть молекулы ДНК с определенными структурными элементами. Как внутри слова есть приставка, корень, суффикс и окончание, позволяющие слову адаптироваться для каждой конкретной фразы, так и у гена есть промотор, экзоны и интроны. Первый обозначает начало гена, экзоны – это ключевая информация о последовательности РНК или белка, а интроны необходимы для регуляции и тонкой настройки работы гена в условиях разных тканей, органов и изменяющейся окружающей среды.

Экспрессия гена – это эффективность работы гена, так как для его функционирования недостаточно его наличия в геноме – с него должна считываться информация. Именно то, как часто и в каком объеме считывается информация с гена, выражают термином экспрессия.

Локус – участок молекулы ДНК, содержащий различный структурные элементы, в том числе один или несколько генов.

Геном– это последовательность всех молекул ДНК организма. Важно помнить, что в каждой клетке одного организма в норме содержатся одинаковые по количеству и последовательностям молекулы ДНК, а различается экспрессия конкретных генов.

Экзом – это последовательности ДНК экзомных участков генов, то есть так называемая основная кодирующая составляющая. Это то, с чем работает организм, в то время как остальная часть генома объясняет, как работать и в каких условиях как применять и настраивать кодирующую часть генома.

Мутация – изменение последовательности ДНК по сравнению другими клетками организма или другими представителями вида. Мутации могут возникать как из-за воздействия внешних неблагоприятных условий, так и из-за того, что наши ферменты работают пусть с редкими, но ошибками. Так как происходит физическое изменение в носителе информации – ДНК, такое изменение может передаваться из поколения в поколение.

Частота мутаций — относительное значение, показывающее у какой доли людей в геноме есть конкретная мутация. Частоту мутации можно рассчитать, как среднюю для всех людей, так и отдельно по расовым или национальным, или любы другим группам. В медицинской генетике под мутацией подразумевают изменение ДНК, которое может быть связано с каким-то заболеванием, и противопоставляют ее полиморфизму. Хотя по общей логике полиморфизм – это частный случай мутации.

Полиморфизм – нейтральная, а точнее безвредная, мутация, которая сравнительно часто встречается у какой-то группы организмов одного вида. Некоторые мутации встречаются часто у всех людей, некоторые – только среди представителей определенных рас или народностей.

Аллель – вариант последовательности гена в разном виде: от различия в одной букве последовательности до отсутствия целого куска последовательности или вставке лишнего. Эти различия возникают из-за мутации, которая могла произойти у далекого предка и передаться потомству через поколения. Таким образом, каждый ген у отдельного человека может быть представлен конкретным вариантом – аллелем. Для понимания аллелизма необходимо объяснить, что, например, различия в цвете глаз, волос, росте, чувствительности к алкоголю объясняются именно разными аллельными состояниями соответствующих генов.

Генотип – это все гены конкретной особи с указанием аллельного состояния каждого гена и наличия/отсутствия мутаций в межгенных участках ДНК.

Доминантный аллель. В геноме человека содержится по 2 копии каждой хромосомы. Это означает, что в каждом геноме есть две очень похожие по длине и последовательности генов молекулы ДНК, которые отличаются аллельными состояниями генов и мутациями/полиморфизмами в межгенных участках этих молекул ДНК. Из этого следует, что и каждый ген представлен в геноме 2 копиями, каждая из которых может быть определенным вариантом (аллелем) этого гена. Доминантным аллелем называется тот, одной копии которого достаточно для проявления его особенностей. То есть если хотя бы на одной из хромосом ген находится в состоянии доминантного аллеля, то ген будет работать по тому варианту, который описывается именно этим аллелем. Важно, что так как у одного гена может быть более двух вариантов (аллелей), то и доминантность аллеля определяется по отношению к каждому из вариантов, хотя есть и те, которые доминантны по сравнению со всеми другими. Встречаются варианты с одинаковой предпочтительностью для работы, тогда проявляется совместное влияние этих вариантов.

Рецессивный аллель – по аналогии с доминантным аллелем, это такое состояние гена, которое наименее предпочтительно для проявления. Поэтому если в геноме есть другая копия гена, доминантная, то задавать темп работы гена будет именно она, но если и вторая копия гена представлена рецессивным аллелем, то будет работать этот, хотя менее предпочтительный, но в такой ситуации единственно имеющийся вариант. Хотя в большинстве случаев связанные с возникновением заболевания аллели рецессивны, это вредность/полезность не является единственным определяющим фактором рецессивности/доминантности аллеля.

Гомозигота. Гомозиготой по определенной мутации/полиморфизму/аллелю называют такую клетку или организм, в генотипе которой/которого обе копии гена на двух хромосомах представлены одним вариантом, то есть не отличаются по этой мутации/полиморфизму/аллелю.

Гетерозигота. Гетерозиготой по определенной мутации/полиморфизму/аллелю называют такую клетку или организм, в генотипе которой/которого две копии гена на двух хромосомах представлены разными вариантами, то есть отличаются по этой мутации/полиморфизму/аллелю.

Секвенирование – это группа методов, позволяющая узнать последовательность нуклеотидов в молекуле ДНК. Этот метод обладает некоторыми особенностями. Во-первых, пока что ни один способ секвенирования не позволяет прочитать всю последовательность одной хромосомы, чтение идет сравнительно небольшими отрезка от 50 до несколько тысяч нуклеотидов. Во-вторых, почти все методы устроены так, что из кусочка ДНК делается много одинаковых и читаются они все. Эта особенность проявляется в таком параметре секвенирования, как глубина секвенирования, обозначаемая 10Х, 20Х, 50Х. Чем больше это значение, тем больше раз прочитан один и тот же кусок молекулы, тем точнее можно выявить ошибки секвенирования и особенности участка, например, его гетерозиготность по какой-либо мутации/полиморфизму.

Гаплотип — совокупность состояний/вариантов определенных локусов, которые расположены на одной хромосоме, и вследствие структурных особенностей эти состояния всегда наследуются вместе. То есть, например, если в одном локусе (1) гаплотипа имеется мутация (1А), а в другом (2) имеется уже другая мутация (2M), то именно в таком составе они будут наследоваться (1А2М), а смешанных вариантов (1B2M или 1A2N) не бывает или они относятся к другому гаплотипу.

Гаплогруппа — совокупность особей, имеющих сходный гаплотип по определенным локусам, которые задаются в соответствии с тем, какую задачу нужно решить, определяя гаплогруппу

Митохондриальная ДНК. Если разбираться подробнее и глубже, то генетическая информация одного человека находится не только в 46 хромосомах, располагающихся в специальном отсеке клетки – ядре, но и в клеточных органах митохондриях. У митохондрий в клетке своя задача – преобразовывать энергию, заключенную в химической связи определенных атомов, в более удобную для клетки, то есть они готовят эффективные питательные запасы из разного сырья. Митохондрии довольно сложны, их оболочка хитро устроена, чтобы опасные побочные продукты готовки не могли попасть в остальную часть клетки, поэтому все время таскать туда нужные для их работы белки не слишком продуктивно. Таким образом, у них есть своя ДНК, которая несет информацию о разных особенных белках и РНК, которые нужны именно для работы митохондрии. Такую ДНК называют митохондриальной и она является неотъемлемой и обязательной частью нашего генотипа. Передается она только от мамы, так как сперматозоид для возможности быстро перемещаться и долго оставаться живым несет самый минимум необходимой генетической информации – 23 хромосомы. А вот яйцеклетка, которой для выполнения основной функции не нужно находится в агрессивной окружающей среде, может позволить себе бОльшую массу и дополнительные запасы в виде готовых к работе станций приготовления питания – митохондрий и заранее синтезированных белков и РНК.

Гены половой дифференцировки – группа генов, играющая ведущую роль в определении будет эмбрион развиваться как девочка или как мальчик. В геноме человека основой проявления мужских или женских половых признаков является наличие/отсутствие половой хромосомы Y, а именно особо локуса этой хромосомы – SRY (Sex-determining Region on the Y chromosome). Важно отметить, что нарушения в этом локусе могут приводить не к внешним проявлениям, а к сниженной репродуктивной способности мужчины или ее полному отсутствию. Процесс дифференцировки пола у человека можно представить тремя стадиями: 1) какой набор хромосом получается при слиянии яйцеклетки (всегда несет хромосому X) и сперматозоида (с хромосомой X или Y), 2) формирование женских или мужских половых органов в зависимости от работы генов локуса SRY, 3) развитие вторичных половых органов в соответствии с типом половых органов. Нарушения на разных этапах приводят к разным проявлениям и разным заболеваниям.

Локус AZF – это участок Y-хромосомы, на котором располагаются так называемые факторы азооспермии (AZF — AZoospermia Factors). Это особые участки, которые названы так, потому что если какой-то из них отсутствует из-за мутации, то развивается азооспермия (отсутствие сперматозоидов) или олигозооспермия (малое количество сперматозоидов). Всего обнаружено три таких фактора AZFa, AZFb и AZFc. В норме наличие всех трех является минимальным необходимым условием нормального формирования сперматозоидов. Если в геноме отсутствует один из AZFa и AZFb или оба, то нарушается созревание сперматозоидов и, как следствие, полностью отсутствует репродуктивная функция. При отсутствии локуса AZFc нарушения могут быть не столь сильными, поэтому деторождение остается возможным в некоторых случаях.

Хромосомные аномалии – это крупные мутации, которые связаны с изменением последовательности ДНК не в рамках отдельного гена или нескольких, а в масштабе хромосомы или генома. Например, отсутствие (делеция) большой части или всей хромосомы, лишняя хромосома, или часть одной хромосомы соединена с частью другой хромосомы и т.д.

Наследственное заболевание – это заболевание, вызванное нарушениями в геноме, то есть мутациями, которые либо мешают формированию нормального белка (так как ген – инструкция по его построению – поврежден), либо изменяют регуляцию, то есть условия, когда, в каком месте или с кем такой белок или ген должен работать.

Моногенное заболевание – это наследственное заболевание, вызванное мутацией в одном только в одном гене. Несмотря на то, что все остальные почти 30000 генов могут быть в порядке, изменение последовательности ДНК в этом гене вызывает нарушения функционирования всего организма.

Хромосомное заболевание – наследственное заболевание, вызванное хромосомными аномалиями.

Носительство мутации – это состояние гетерозиготы по аллелю, обладающему какими-то негативными клиническими проявлениями, если он находится в геноме в виде гомозиготы.

Пробанд – человек, с которого начинается составление генеалогического дерева (родословной). Обычно пробанд – это носитель или пациент с наследственным заболеванием, проявление которого и вызвало необходимость генеалогического анализа.

Сиблинг – в генетике таким термином обозначают потомков одних родителей, то есть братьев и сестер, но не близнецов.

Автор: Жикривецкая Светлана

Биолог-исследователь

Цены на услуги – Генетический паспорт

Обратите внимание, что данная страница с ценами — это калькулятор. Вы можете выбрать в выпадающем списке ниже интересующий вас комплекс, нажимать на блоки с ценами, чтобы узнать итоговую стоимость. Мы не запоминаем ваш выбор, эти данные никуда не отправляются и нигде не хранятся! Пожалуйста, учитывайте это, когда будете записываться на приём.


Загрузить прейскурант в виде документа pdf можно по этой ссылке .


Основной комплекс 0 Дополнительный комлекс 0 Полный комплекс 0

Итоговая стоимость выбранных генов составляет

171.00 BYN

 

Показать цены для нерезидентов

Уникальная технология количественной оценки генетического риска невынашивания беременности (обновлено)

Внимание. Мы снижаем стоимость исследования – с 01.11.2021 до 31.12.2021 года действует акция, по которой цена тестирования комплекса из 25 генов, ассоциированного с невынашиванием беременности, СНИЖЕНА НА 25%.

Полный текст читайте в разделе сайта «Новости»


Цены на сайте указаны без скдики.

Генная картина – это уникальный генетический портрет человека.

Художественное переосмысление научных достижений в генетике позволяет создавать генетический портрет человека. Картина представляет собой необычное изображение, основу которого составляют гены конкретного человека. И сколько бы тысяч лет ни прошло, на Земле не появится вторая такая картина. Потому что ДНК-код, зашифрованный в наших генах, уникален и никогда не повторяется.

Генные картины – это возможность сделать интерьер своего дома по-настоящему уникальным, это не только изысканное и новаторское украшение интерьера, но еще и прекрасно оформленное наглядное доказательство нашей природной уникальности, которое создает в доме неповторимую атмосферу и придает ему незабываемые индивидуальные черты. Генная картина.

Этапы создания:

  • ДНК, выделенная из слюны либо капли крови человека, подвергается полимеразной цепной реакции, в ходе которой определенные участки ДНК умножаются (копируются) в миллион раз. Далее раствор, насыщенный миллионами копий фрагментов ДНК наносится на специальный гель, к которому подается электрическое напряжение. Под воздействием электрического поля исследуемые фрагменты ДНК перемещаются на определенные расстояния, пропорциональные их массе, создавая неповторимый графический узор;
  • Изображение наносится методом цифровой печати на бумагу, стекло либо создается художником на холсте. Заказчик сам выбирает материал, цветовое решение и размер картины.

Вместе с генной картиной выдается сертификат, подтверждающий достоверность и уникальность данного генетического портрета.

Картина представляет собой необычное изображение, основу которого составляют гены конкретного человека, и отображает его генетическую уникальность. Прекрасно оформленная генная картина создает в доме неповторимую атмосферу и придает ему незабываемые индивидуальные черты. Вместе с картиной выдаётся сертификат, подтверждающий достоверность и уникальность данного генетического портрета.

Стоимость анализа для резидентов Республики Беларусь составляет 367.60 BYN. Для нерезидентов – 460.20 BYN. Стоимость указана без разработки оригинал-макета генной картины и без печатных работ.

Паспорт здоровья содержит в себе результаты генетического анализа по всем полиморфизмам генов, исследуемых в лаборатории.

Отличная идея!

Получите второй генетический паспорт по предрасположенности к ССЗ (сердечно-сосудистым заболеваниям) всего за BYN! Гены, ответственные за невынашивание, во время не беременности никуда не «исчезают». И их неблагоприятные эффекты можно рассматривать как риск развития сердечно-сосудистых заболеваний (инсульты, инфаркты и др.). Получить второй генетический паспорт – это отличная идея.

Архитектура полиморфизмов в геноме человека выявляет функционально важные и положительно выбранные варианты в генах иммунного ответа и переносчиков лекарств | Human Genomics

  • 1.

    Коллинз Ф.С., Брукс Л.Д., Чакраварти А. Ресурс по открытию полиморфизма ДНК для исследования генетической изменчивости человека. Genome Res. 1998. 8: 1229–31.

    CAS
    Статья

    Google ученый

  • 2.

    Dimas AS, Deutsch S, Stranger BE, Montgomery SB, Borel C, Attar-Cohen H, Ingle C, Beazley C, Gutierrez Arcelus M, Sekowska M, et al.Общие регуляторные вариации влияют на экспрессию генов в зависимости от типа клетки. Наука. 2009; 325: 1246–50.

    CAS
    Статья

    Google ученый

  • 3.

    Montgomery SB, Sammeth M, Gutierrez-Arcelus M, Lach RP, Ingle C, Nisbett J, Guigo R, Dermitzakis ET. Генетика транскриптома с использованием секвенирования второго поколения в популяции европеоидной расы. Природа. 2010; 464: 773–7.

    CAS
    Статья

    Google ученый

  • 4.

    Майерс А.Дж., Гиббс Дж. Р., Вебстер Дж. А., Рорер К., Чжао А., Марлоу Л., Калим М., Леунг Д., Брайден Л., Нат П. и др. Обзор генетической экспрессии генов коры головного мозга человека. Нат Жене. 2007; 39: 1494–9.

    CAS
    Статья

    Google ученый

  • 5.

    Пикрелл Дж. К., Мариони Дж. К., Пай А. А., Дегнер Дж. Ф., Энгельгардт Б. Э., Нкадори Е., Вейриерас Дж. Б., Стивенс М., Гилад Ю., Притчард Дж. К.. Понимание механизмов, лежащих в основе вариабельности экспрессии генов человека, с помощью секвенирования РНК.Природа. 2010; 464: 768–72.

    CAS
    Статья

    Google ученый

  • 6.

    Schadt EE, Molony C, Chudin E, Hao K, Yang X, Lum PY, Kasarskis A, Zhang B, Wang S, Suver C, et al. Картирование генетической архитектуры экспрессии генов в печени человека. PLoS Biol. 2008; 6: e107.

    Артикул

    Google ученый

  • 7.

    Stranger BE, Forrest MS, Clark AG, Minichiello MJ, Deutsch S, Lyle R, Hunt S, Kahl B., Antonarakis SE, Tavare S, et al.Полногеномные ассоциации вариаций экспрессии генов у людей. PLoS Genet. 2005; 1: e78.

    Артикул

    Google ученый

  • 8.

    Stranger BE, Nica AC, Forrest MS, Dimas A, Bird CP, Beazley C, Ingle CE, Dunning M, Flicek P, Koller D, et al. Популяционная геномика экспрессии генов человека. Нат Жене. 2007; 39: 1217–24.

    CAS
    Статья

    Google ученый

  • 9.

    Veyrieras JB, Kudaravalli S, Kim SY, Dermitzakis ET, Gilad Y, Stephens M, Pritchard JK.Картирование экспрессионных QTL с высоким разрешением дает представление о регуляции генов человека. PLoS Genet. 2008; 4: e1000214.

    Артикул

    Google ученый

  • 10.

    Целлер Т., Вайлд П., Шимчак С., Ротиваль М., Шиллер А., Кастань Р., Мауш С., Жермен М., Лакнер К., Россманн Х. и др. Генетика и не только — транскриптом человеческих моноцитов и восприимчивость к болезням. PLoS One. 2010; 5: e10693.

    Артикул

    Google ученый

  • 11.

    Аджубей ИА, Шмидт С, Пешкин Л, Раменский В.Е., Герасимова А, Борк П, Кондрашов АС, Сюняев СР. Метод и сервер для предсказания повреждающих миссенс-мутаций. Нат методы. 2010; 7: 248–9.

    CAS
    Статья

    Google ученый

  • 12.

    Карчин Р., Диханс М., Келли Л., Томас Д. Д., Пипер У., Эсвар Н., Хаусслер Д., Сали А. LS-SNP: крупномасштабная аннотация кодирования несинонимичных SNP на основе нескольких источников информации. Биоинформатика.2005; 21: 2814–20.

    CAS
    Статья

    Google ученый

  • 13.

    Юэ П., Меламуд Э., Молт Дж. SNPs3D: ген-кандидат и отбор SNP для ассоциативных исследований. BMC Bioinformatics. 2006; 7: 166.

    Артикул

    Google ученый

  • 14.

    Ng PC, Хеникофф С. Учет человеческих полиморфизмов, которые, по прогнозам, влияют на функцию белка. Genome Res. 2002; 12: 436–46.

    CAS
    Статья

    Google ученый

  • 15.

    Ли Б., Кришнан В.Г., Морт М.Э., Синь Ф., Камати К.К., Купер Д.Н., Муни С.Д., Радивояк П. Автоматизированный вывод молекулярных механизмов заболевания на основе аминокислотных замен. Биоинформатика. 2009; 25: 2744–50.

    CAS
    Статья

    Google ученый

  • 16.

    Thomas PD, Kejariwal A, Guo N, Mi H, Campbell MJ, Muruganujan A, Lazareva-Ulitsky B. Приложения для данных эволюции последовательности-функции белка: анализ экспрессии мРНК / белка и инструменты оценки кодирующих SNP.Nucleic Acids Res. 2006; 34: W645–50.

    Артикул

    Google ученый

  • 17.

    Каприотти Э., Калабрезе Р., Касадио Р. Прогнозирование роста генетических заболеваний человека, связанных с точечными мутациями белков, с помощью опорных векторных машин и эволюционной информации. Биоинформатика. 2006; 22: 2729–34.

    CAS
    Статья

    Google ученый

  • 18.

    Масица Д.Л., Карчин Р.На пути к повышению клинической значимости методов in silico для прогнозирования патогенных миссенс-вариантов. PLoS Comput Biol. 2016; 12: e1004725.

    Артикул

    Google ученый

  • 19.

    Петерсон Т.А., Даути Э., Канн М.Г. На пути к точной медицине: достижения в вычислительных подходах к анализу человеческих вариантов. J Mol Biol. 2013; 425: 4047–63.

    CAS
    Статья

    Google ученый

  • 20.

    Фабер К., Глаттинг К.Х., Мюллер П.Дж., Риш А., Хотц-Вагенблатт А. Прогнозирование в масштабе всего генома модифицирующих сплайсинг SNP в генах человека с использованием нового конвейера анализа, называемого AASsites. BMC Bioinformatics. 2011; 12 (Приложение 4): S2.

    Артикул

    Google ученый

  • 21.

    Ян Дж.О., Ким В.Й., Бхак Дж. SsSNPTarget: полногеномная база данных однонуклеотидного полиморфизма сайтов сплайсинга. Hum Mutat. 2009; 30: E1010–20.

    Артикул

    Google ученый

  • 22.

    Kim BC, Kim WY, Park D, Chung WH, Shin KS, Bhak J. SNP @ Promoter: база данных человеческих SNP (однонуклеотидных полиморфизмов) в предполагаемых промоторных областях. BMC Bioinformatics. 2008; 9 (Приложение 1): S2.

    Артикул

    Google ученый

  • 23.

    Bao L, Zhou M, Wu L, Lu L, Goldowitz D, Williams RW, Cui Y. База данных PolymiRTS: связывание полиморфизмов в целевых сайтах микроРНК со сложными признаками. Nucleic Acids Res. 2007; 35: D51–4.

    CAS
    Статья

    Google ученый

  • 24.

    Hiard S, Charlier C, Coppieters W, Georges M, Baurain D. Patrocles: база данных полиморфной miRNA-опосредованной регуляции генов у позвоночных. Nucleic Acids Res. 2010; 38: D640–51.

    CAS
    Статья

    Google ученый

  • 25.

    Гонг Дж., Тонг И, Чжан Х.М., Ван К., Ху Т., Шань Дж., Сунь Дж., Го А.Ю. Полногеномная идентификация SNP в генах микроРНК и влияние SNP на связывание микроРНК-мишени и биогенез. Hum Mutat. 2012; 33: 254–63.

    CAS
    Статья

    Google ученый

  • 26.

    Ван Дж., Ронаги М., Чонг С.С., Ли К.Г. pfSNP: интегрированный потенциально функциональный ресурс SNP, который облегчает генерацию гипотез посредством синтеза знаний. Hum Mutat. 2011; 32: 19–24.

    Артикул

    Google ученый

  • 27.

    Conde L, Vaquerizas JM, Santoyo J, Al-Shahrour F, Ruiz-Llorente S, Robledo M, Dopazo J.PupaSNP Finder: веб-инструмент для поиска SNP с предполагаемым эффектом на уровне транскрипции. Nucleic Acids Res. 2004; 32: W242–8.

    CAS
    Статья

    Google ученый

  • 28.

    Akey JM, Zhang G, Zhang K, Jin L, Shriver MD. Опрос карты SNP с высокой плотностью на предмет признаков естественного отбора. Genome Res. 2002; 12: 1805–14.

    CAS
    Статья

    Google ученый

  • 29.

    Sabeti PC, Varilly P, Fry B, Lohmueller J, Hostetter E, Cotsapas C, Xie X, Byrne EH, McCarroll SA, Gaudet R, et al. Полногеномное обнаружение и характеристика положительного отбора в человеческих популяциях. Природа. 2007; 449: 913–8.

    CAS
    Статья

    Google ученый

  • 30.

    Баррейро Л.Б., Лаваль Дж., Куач Х., Патин Э., Кинтана-Мурси Л. Естественный отбор привел к дифференциации популяций современных людей. Нат Жене. 2008; 40: 340–5.

    CAS
    Статья

    Google ученый

  • 31.

    Чен К., Раевский Н. Естественный отбор на сайтах связывания микроРНК человека, выведенный из данных SNP. Нат Жене. 2006; 38: 1452–6.

    CAS
    Статья

    Google ученый

  • 32.

    Jha P, Lu D, Xu S. Естественный отбор и функциональные возможности некодирующих элементов человека, выявленные в результате анализа данных секвенирования следующего поколения.PLoS One. 2015; 10: e0129023.

    Артикул

    Google ученый

  • 33.

    Энард Д., Мессер П.В., Петров Д.А. Общегеномные сигналы положительного отбора в эволюции человека. Genome Res. 2014; 24: 885–95.

    CAS
    Статья

    Google ученый

  • 34.

    Нильсен Р. Молекулярные признаки естественного отбора. Анну Рев Жене. 2005; 39: 197–218.

    CAS
    Статья

    Google ученый

  • 35.

    Bejerano G, Pheasant M, Makunin I, Stephen S, Kent WJ, Mattick JS, Haussler D. Ультраконсервированные элементы в геноме человека. Наука. 2004; 304: 1321–5.

    CAS
    Статья

    Google ученый

  • 36.

    Вандиедонк К., Найт Дж. К.. Главный комплекс гистосовместимости человека как парадигма в геномных исследованиях. Краткая функция геномной протеомики. 2009; 8: 379–94.

    CAS
    Статья

    Google ученый

  • 37.

    Зангер У.М., Шваб М. Ферменты цитохрома P450 в метаболизме лекарств: регуляция экспрессии генов, активности ферментов и влияние генетической изменчивости. Pharmacol Ther. 2013; 138: 103–41.

    CAS
    Статья

    Google ученый

  • 38.

    Бересфорд А.П. CYP1A1: друг или враг? Drug Metab Rev.1993; 25: 503–17.

    CAS
    Статья

    Google ученый

  • 39.

    Ван Б., Ян Л.П., Чжан ХЗ, Хуанг С.К., Бартлам М., Чжоу С.Ф.Новое понимание структурных характеристик и функциональной значимости фермента цитохрома P450 2D6 человека. Препарат Метаб Ред. 2009; 41: 573–643.

    CAS
    Статья

    Google ученый

  • 40.

    Лепешева Г.И., Ватерман М.Р. Стерол 14альфа-деметилаза цитохром P450 (CYP51), P450 во всех биологических царствах. Biochim Biophys Acta. 2007; 1770: 467–77.

    CAS
    Статья

    Google ученый

  • 41.

    Дин М., Ржецкий А., Алликметс Р. Суперсемейство переносчиков человеческих АТФ-связывающих кассет (АВС). Genome Res. 2001; 11: 1156–66.

    CAS
    Статья

    Google ученый

  • 42.

    Бейкер А., Диджей Кэрриер, Шедлер Т., Уотерхэм Х. Р., ван Рурмунд К. В., Теодулу, Флорида. Переносчики пероксисомальных ABC: функции и механизм. Biochem Soc Trans. 2015; 43: 959–65.

    CAS
    Статья

    Google ученый

  • 43.

    Абеллан Р., Мансего М.Л., Мартинес-Эрвас С., Мартин-Эскудеро Дж. К., Кармена Р., Реал Дж. Т., Редон Дж., Кастродеза-Санс Дж. Дж., Чавес Ф. Дж. Ассоциация выбранных однонуклеотидных полиморфизмов семейства генов ABC с липопротеинами после приема пищи: результаты популяционного исследования Hortega. Атеросклероз. 2010; 211: 203–9.

    CAS
    Статья

    Google ученый

  • 44.

    Akey JM. Построение геномных карт положительного отбора у людей: что нам делать дальше? Genome Res.2009; 19: 711–22.

    CAS
    Статья

    Google ученый

  • 45.

    Brion M, Sanchez-Salorio M, Corton M, de la Fuente M, Pazos B, Othman M, Swaroop A, Abecasis G, Sobrino B, Carracedo A, Испанская многоцентровая группа AMD. Исследование генетической ассоциации возрастной дегенерации желтого пятна у населения Испании. Acta Ophthalmol. 2011; 89: e12–22.

    Артикул

    Google ученый

  • 46.

    Chu LW, Li Y, Li Z, Tang AY, Cheung BM, Leung RY, Yik PY, Jin DY, Song YQ. Новый интронный полиморфизм гена ABCA1 показывает риск спорадической болезни Альцгеймера у китайцев. Am J Med Genet B Neuropsychiatr Genet. 2007; 144B: 1007–13.

    CAS
    Статья

    Google ученый

  • 47.

    Джеймисон С.Е., де Рубе Л.А., Кортина-Борха М., Тан Х.К., Муи Э.Дж., Корделл Х.Дж., Кириситс М.Дж., Миллер Э.Н., Пикок С.С., Харгрейв А.С. и др. Генетические и эпигенетические факторы COL2A1 и ABCA4 влияют на клинический исход врожденного токсоплазмоза.PLoS One. 2008; 3: e2285.

    Артикул

    Google ученый

  • 48.

    Джордан де Луна С., Эрреро Сервера М.Дж., Санчес Лазаро I, Альменар Бонет Л., Поведа Андрес Дж.Л., Алино Пеллисер С.Ф. Фармакогенетическое исследование генов ABCB1 и CYP3A5 в течение первого года после трансплантации сердца на предмет уровней такролимуса или циклоспорина. Transplant Proc. 2011; 43: 2241–3.

    CAS
    Статья

    Google ученый

  • 49.

    Джуньент М., Такер К.Л., Смит К.Э., Гарсия-Риос А., Маттеи Дж., Лай К.К., Парнелл Л.Д., Ордовас Дж. М.. Влияние полиморфизма ABCG5 / G8 на концентрацию холестерина ЛПВП в плазме зависит от привычки курить, согласно Бостонскому исследованию здоровья в Пуэрто-Рико. J Lipid Res. 2009. 50: 565–73.

    CAS
    Статья

    Google ученый

  • 50.

    Коловоу В., Марваки А., Каракоста А., Василопулос Г., Калогиани А., Маврогени С., Дегианнис Д., Марваки С., Коловоу Г. Ассоциация пола, полиморфизмов гена ABCA1 и профиля липидов у молодых медсестер Греции.Lipids Health Dis. 2012; 11: 62.

    CAS
    Статья

    Google ученый

  • 51.

    Li Q, Yin RX, Wei XL, Yan TT, Aung LH, Wu DF, Wu JZ, Lin WX, Liu CW, Pan SL. АТФ-связывающий кассетный транспортер полиморфизмы G5 и G8 и несколько факторов окружающей среды с уровнями липидов в сыворотке. PLoS One. 2012; 7: e37972.

    CAS
    Статья

    Google ученый

  • 52.

    Ма XY, Liu JP, Song ZY.Связь полиморфизма АТФ-связывающего кассетного транспортера A1 R219K с уровнем ХС-ЛПВП и риском ишемической болезни сердца: метаанализ. Атеросклероз. 2011; 215: 428–34.

    CAS
    Статья

    Google ученый

  • 53.

    Miura K, Yoshiura K, Miura S, Shimada T, Yamasaki K, Yoshida A, Nakayama D, Shibata Y, Niikawa N, Masuzaki H. Сильная связь между ушной серой человека и секрецией апокринного молозива из молочная железа.Hum Genet. 2007; 121: 631–3.

    Артикул

    Google ученый

  • 54.

    Накано М., Мива Н., Хирано А., Йошиура К., Ниикава Н. Сильная связь подмышечного осмидроза с влажным типом ушной серы, определяемая генотипированием гена ABCC11. BMC Genet. 2009; 10: 42.

    Артикул

    Google ученый

  • 55.

    Oh IH, Oh C, Yoon TY, Choi JM, Kim SK, Park HJ, Eun YG, Chung DH, Kwon KH, Choe BK.Ассоциация полиморфизмов гена CFTR с папиллярным раком щитовидной железы. Oncol Lett. 2012; 3: 455–61.

    CAS
    Статья

    Google ученый

  • 56.

    Ота М., Фуджи Т., Немото К., Тацуми М., Моригути Ю., Хашимото Р., Сато Н., Ивата Н., Кунуги Х. Полиморфизм гена ABCA1 придает предрасположенность к шизофрении и связанным с ней изменениям мозга. Prog Neuro-Psychopharmacol Biol Psychiatry. 2011; 35: 1877–83.

    CAS
    Статья

    Google ученый

  • 57.

    Сайнц Дж., Рудольф А., Хайн Р., Хоффмайстер М., Бух С., фон Шонфельс В., Хампе Дж., Шафмайер С., Фольцке Х., Франк Б. и др. Ассоциация генетических полиморфизмов генов ESR2, HSD17B1, ABCB1 и SHBG с риском колоректального рака. Endocr Relat Cancer. 2011; 18: 265–76.

    CAS
    Статья

    Google ученый

  • 58.

    Sundar PD, Feingold E, Minster RL, DeKosky ST, Kamboh MI. Гендерно-специфическая ассоциация полиморфизмов переносчика 1 АТФ-кассеты (ABCA1) с риском позднего начала болезни Альцгеймера.Neurobiol Aging. 2007. 28: 856–62.

    CAS
    Статья

    Google ученый

  • 59.

    Йошиура К., Киношита А., Исида Т., Ниноката А., Исикава Т., Канаме Т., Баннаи М., Токунага К., Сонода С., Комаки Р. и др. SNP в гене ABCC11 является детерминантой типа ушной серы человека. Нат Жене. 2006; 38: 324–30.

    CAS
    Статья

    Google ученый

  • 60.

    Montgomery SB, Goode DL, Kvikstad E, Albers CA, Zhang ZD, Mu XJ, Ananda G, Howie B, Karczewski KJ, Smith KS, et al.Происхождение, эволюция и функциональное влияние вариантов с короткой инсерцией-делецией, идентифицированных в 179 геномах человека. Genome Res. 2013; 23: 749–61.

    CAS
    Статья

    Google ученый

  • 61.

    Levenstien MA, Klein RJ. Прогнозирование функционально важных классов SNP на основе отрицательного отбора. BMC Bioinformatics. 2011; 12:26.

    Артикул

    Google ученый

  • 62.

    Saunders MA, Liang H, Li WH.Полиморфизм человека в сайтах-мишенях микроРНК и микроРНК. Proc Natl Acad Sci U S. A. 2007; 104: 3300–5.

    CAS
    Статья

    Google ученый

  • 63.

    Hsiao YH, Bahn JH, Lin X, Chan TM, Wang R, Xiao X. Альтернативный сплайсинг, модулируемый генетическими вариантами, демонстрирует ускоренную эволюцию, регулируемую высококонсервативными белками. Genome Res. 2016; 26: 440–50.

    CAS
    Статья

    Google ученый

  • 64.

    Троусдейл Дж. MHC, болезнь и отбор. Immunol Lett. 2011; 137: 1–8.

    CAS
    Статья

    Google ученый

  • 65.

    Suo C, Xu H, Khor CC, Ong RT, Sim X, Chen J, Tay WT, Sim KS, Zeng YX, Zhang X и др. Естественный положительный отбор и генетическое разнообразие север-юг в Восточной Азии. Eur J Hum Genet. 2012; 20: 102–10.

    CAS
    Статья

    Google ученый

  • 66.

    Jiang Y, Zhang H. Непараметрический тест, основанный на оценке склонности, выявляющий генетические варианты, лежащие в основе биполярного расстройства. Genet Epidemiol. 2011; 35: 125–32.

    Артикул

    Google ученый

  • 67.

    Росс К.А. Доказательства конверсии и делеции соматических генов при биполярном расстройстве, болезни Крона, ишемической болезни сердца, гипертонии, ревматоидном артрите, диабете 1 типа и диабете 2 типа. BMC Med. 2011; 9: 12.

    Артикул

    Google ученый

  • 68.

    Genomes Project C, Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang HM, Marth GT, McVean GA. Интегрированная карта генетических вариаций из 1092 геномов человека. Природа. 2012; 491: 56–65.

    Артикул

    Google ученый

  • 69.

    Zhou Y, Ingelman-Sundberg M, Lauschke VM. Распространение аллелей цитохрома P450 по всему миру: метаанализ проектов секвенирования в масштабе популяции. Clin Pharmacol Ther. 2017; 102: 688–700.

    CAS
    Статья

    Google ученый

  • 70.

    Bank PCD, Swen JJ, Guchelaar HJ. Применение фармакогеномики в повседневной клинической практике. Adv Pharmacol. 2018; 83: 219–46.

    Артикул

    Google ученый

  • 71.

    Fujikura K, Ingelman-Sundberg M, Lauschke VM. Генетическая изменчивость супергенного семейства цитохрома P450 человека. Pharmacogenet Genomics. 2015; 25: 584–94.

    CAS
    Статья

    Google ученый

  • 72.

    Охаши Дж., Нака И., Цучия Н. Влияние естественного отбора на SNP ABCC11, определяющее тип ушной серы. Mol Biol Evol. 2011; 28: 849–57.

    CAS
    Статья

    Google ученый

  • 73.

    Радж Т., Кучру М., Реплогл Дж. М., Райчаудхури С., Незнакомец Б. Е., Де Джагер ПЛ. Аллели общего риска воспалительных заболеваний являются мишенями недавнего положительного отбора.Am J Hum Genet. 2013; 92: 517–29.

    CAS
    Статья

    Google ученый

  • 74.

    Амато Р., Пинелли М., Монтичелли А., Марино Д., Миле Дж., Кокоцца С. Сканирование всего генома для выявления признаков дифференциации человеческой популяции и их взаимосвязи с естественным отбором, функциональными путями и заболеваниями. PLoS One. 2009; 4: e7927.

    Артикул

    Google ученый

  • 75.

    Musumeci L, Arthur JW, Cheung FS, Hoque A, Lippman S, Reichardt JK.Однонуклеотидные различия (SND) в базе данных dbSNP могут привести к ошибкам в исследованиях генотипирования и гаплотипирования. Hum Mutat. 2010; 31: 67–73.

    CAS
    Статья

    Google ученый

  • 76.

    Genomes Project C, Abecasis GR, Altshuler D, Auton A, Brooks LD, Durbin RM, Gibbs RA, Hurles ME, McVean GA. Карта вариаций генома человека по результатам популяционного секвенирования. Природа. 2010; 467: 1061–73.

    Артикул

    Google ученый

  • 77.

    Voight BF, Kudaravalli S, Wen X, Pritchard JK. Карта недавнего положительного отбора в геноме человека. PLoS Biol. 2006; 4: e72.

    Артикул

    Google ученый

  • 78.

    Хуанг Д. В., Шерман Б.Т., Лемпицки РА. Систематический и комплексный анализ больших списков генов с использованием ресурсов биоинформатики DAVID. Nat Protoc. 2009. 4: 44–57.

    CAS
    Статья

    Google ученый

  • 79.

    Huang d W., Sherman BT, Lempicki RA. Инструменты обогащения биоинформатики: пути к всестороннему функциональному анализу больших списков генов. Nucleic Acids Res. 2009; 37: 1–13.

    Артикул

    Google ученый

  • Полиморфизмы, эпигенетика и что-то между ними

    В самом широком смысле сказать, что фенотип является эпигенетическим, предполагает, что он возникает без изменений в последовательности ДНК, но передается по наследству через деление клеток и иногда от одного поколения организма к другому. .Поскольку регуляторные изменения генов часто происходят в ответ на стимулы окружающей среды и могут сохраняться в дочерних клетках, растет ожидание того, что чей-то опыт может иметь последствия для последующих поколений и, таким образом, повлиять на эволюцию, отделяя выбираемый фенотип от лежащего в его основе наследственного генотипа. Но риск такого чрезмерного использования «эпигенетики» — это сочетание реальных случаев наследственной генетической информации, не связанной с последовательностями, с тривиальными способами регуляции генов. Взгляд на термин «эпигенетический» и некоторые проблемы, связанные с его растущей распространенностью, свидетельствует в пользу более сдержанного и точного набора определяющих характеристик.Кроме того, вопросы, возникающие о том, как мы определяем аспект эпигенетического наследования «независимость от последовательностей», предполагают форму эволюции генома в результате индуцированных полиморфизмов в повторяющихся локусах (например, рДНК или гетерохроматин).

    1. Эпигенетика и эволюция

    Важность полиморфизмов последовательностей в эволюции фундаментальна и неопровержима. Роль эпигенетической регуляции генов изучена значительно хуже. С этой точки зрения я не буду пытаться суммировать все исследования, которые внесли свой вклад в наше нынешнее понимание эпигенетики; вместо этого я объединю несколько важных исследований, взятых в частности, но не исключительно из исследований дрозофилы, чтобы осветить, как общая и последующая «эпигенетическая» регуляция генов может быть результатом индуцированного полиморфизма.Включение индуцированного полиморфизма в арсенал эпигенетических механизмов регуляции генов может заставить нас пересмотреть наши определения, но согласуется с текущим и историческим использованием «эпигенетики» и может предоставить новый механизм для понимания того, насколько стабильными могут быть изменения в экспрессии генов. установлено и поддерживается.

    Чтобы понять роль эпигенетики в эволюции, необходимо рассмотреть определения как эволюции, так и эпигенетики. Для целей любого обсуждения, связывающего эти два, «эволюция» должна расширяться, чтобы включать изменение частоты фенотипических вариантов независимо от лежащих в основе аллельных вариантов.Это небольшое отклонение от ориентированного на последовательность взгляда на изменения частот аллелей в развивающихся популяциях, но, по иронии судьбы, больше соответствует первоначальному использованию термина «эпигенетический» для описания абстрактных процессов, которые производят фенотип из генотипа до выяснения причин. центральная догма, регуляция генов и генетика развития. Итак, «эпигенетика» — это примеры изменений в регуляции генов, которые не соответствуют лежащим в основе изменениям в нуклеотидной последовательности. Стоит остановиться на том, что подразумевается под «изменениями в нуклеотидной последовательности», что я и сделаю позже.В общем, изменения в нуклеотидной последовательности являются «полиморфизмами», хотя обычно их называют «генетическими», чтобы противопоставить их «эпигенетическим». Однако это неправильное использование, а генетика — это изучение наследования и изменчивости, независимо от их причины; полиморфизм и эпигенетика — это подмножества генетики, и, как я надеюсь убедить вас, они не являются ни исключительными, ни исчерпывающими (рис. 1).

    Понимание совместного вклада в эволюцию полиморфизма и эпигенетики, особенно последней, требует понимания разницы между ними.Это различие является глубоким, поскольку, хотя считается, что полиморфизмы характеризуются случайными, постоянными и хорошо изученными изменениями генетической информации, эпигенетическая регуляция генов более изменчива и, следовательно, стала включать индуцированные и обратимые изменения наследственных признаков. Это порождает популярное (но несправедливое) мнение Жана-Батиста де Ламарка о том, что наши собственные действия или опыт могут повлиять на наше потомство. Ламарк предполагал, что организм эволюционирует, передавая свой опыт потомству.На первый взгляд, наследование приобретенных характеристик соответствовало медленной смене видов с течением времени. Лишь после того, как Вейсманн сформулировал трудности, связанные с шеей жирафа, обсуждая свой опыт со спермой жирафа, ламарковский механизм эволюции был отброшен. Возрождение ламарковских моделей эволюции произошло недавно по ряду причин. Во-первых, есть четкие примеры наследования информации вне последовательности ДНК, что открыло возможность влияния опыта, влияющего на экспрессию генов, и передачи таких изменений в экспрессии потомству.Во-вторых, эта гипотетическая модель не только возможна, но и является еретической, провокационной и, следовательно, захватывающей. В-третьих, возможно, многие из нас чувствуют себя более чем немного виноватыми, высмеивая в остальном выдающегося ученого, который ошибся.

    2. Что такое эпигенетика?

    Четкое, краткое и исчерпывающее определение эпигенетики сложно сформулировать не потому, что это сложно per se , а потому, что этот термин расширился за последнее десятилетие и начал включать в себя вещи, которые, возможно, не являются эпигенетическими. .Чтобы прояснить ситуацию, Янгсон и Уайтлоу дали убедительное описание разницы между двумя типами «эпигенетики»: трансмиссивными изменениями экспрессии (которые они назвали «трансгенерационными эпигенетическими эффектами») и трансмиссивными модификациями хромосом («трансгенеративным эпигенетическим наследованием») [1 , 2]. Они пытались разделить два очень разных набора явлений, которые описываются как эпигенетические. Многие случаи «эпигенетики» в недавней литературе попадают в первую категорию и вообще не являются эпигенетическими, а скорее являются примерами регуляции генов половых клеток.Чтобы быть значимым отличием от простых форм регуляции генов «экспрессия фактора транскрипции и усиления усилителя», эпигенетические явления должны проявлять три характеристики: они должны проявляться как (1) наследственные генетические изменения, которые (2) связаны с хромосомами, но (3) не основаны на последовательности ДНК. . Это критерии, от которых не следует отказываться, но их следует оценить.

    Вторая характеристика важна, потому что она составляет сущность эпигенетического наследования. Почему? Потому что, если бы эпигенетика не требовала ассоциации хромосом, каждый генетический путь, включающий петлю положительной обратной связи, был бы эпигенетическим.Специфический для самок летальный сплайсинг у Drosophila с образованием более активного сексуально-летального фактора сплайсинга будет считаться эпигенетическим. Бактериальная экспрессия LacY, пермеазы лактозы, повышающая чувствительность к дальнейшему воздействию лактозы, будет считаться эпигенетической. Аутофосфорилирование CaMKII при наблюдении всплеска кальция можно считать эпигенетическим. Вызванная супрессором безволосая экспрессия Notch, активатора супрессора-безволосого, будет считаться эпигенетической. Короче говоря, почти каждую генетическую сеть можно считать эпигенетической, и «эпигенетика» не будет существенно отличаться от «генной регуляции».«Поскольку белки, липиды, РНК, промежуточные продукты метаболизма и даже токсины проходят через клеточное деление в цитоплазме, тривиально говорить, что их эффекты« наследуются », и ошибочно делать вывод, что клетки сохраняют последствия своих предшественников». переживания обязательно эпигенетичны.

    Не требуя хромосомного наследования эпигенетических явлений, экспрессии в зародышевой линии было бы достаточно для разграничения любого генетического пути как эпигенетического, что служило бы просто для переименования тех генов, которые экспрессируются во время создания яйцеклеток и сперматозоидов.Неудивительно, что такие сети могут охватывать несколько поколений организмов; в конце концов, именно генетика (и опыт) матери создают яйцеклетку, а генетика (и опыт) отца создают сперму; изменение этих процессов, безусловно, приведет к изменениям в следующем поколении. Биология млекопитающих еще больше усугубляет проблему, поскольку в поздних сроках беременности могут участвовать три концентрических организма: к концу беременности самки млекопитающих содержат половину генома всех своих потенциальных внуков; Ооциты, содержащие эти пронуклеусы, заполнены генными продуктами, созданными их матерями из питательной среды, предоставленной их бабушкой.Многие случаи, называемые эпигенетическими, вместо этого представляют собой эту форму регуляции трансгенеративного гена.

    Чтобы отличить широкие концепции «памяти» или «потенцирования» в регуляции генов от специфического эпигенетического наследования, необходимо показать, что эпигенетические факторы, изменяющие активность гена, специфически картируются в регулируемом хромосомном локусе. Экспериментально демонстрируется регуляция эпигенетического гена , когда ДНК нарушает закон массового действия : две идентичные последовательности могут действовать по-разному, несмотря на идентичность их последовательностей и белков, которые с ними связываются.Концептуально, если «наивная» ДНК будет введена в систему, будет ли она вести себя так же, как существующие ДНК? Если так, то это не эпигенетика. На практике это легче всего показать, продемонстрировав, что идентичные фрагменты ДНК (гомологи, дупликации, трансгены, особи повторяющихся массивов генов и т. Д.) Обладают разным поведением. Это было показано для идентичности центромер [3, 4], геномного импринтинга у млекопитающих [5], растений [6-8], грибов [9, 10], нематод [11] и насекомых [12-14]; именно это требование не проверяется многими примерами «эпигенетики».Сильная связь между эпигенетикой и структурой хроматина только способствовала объединению этих терминов. Нет ничего необычного в том, чтобы найти термин «эпигенетический» в исследованиях, которые просто показывают изменения в гистоновых модификациях гена, возможно даже ацетилирование, без экспериментов, которые проверяют наследуемость, полиморфизм последовательностей или хромосомную ассоциацию.

    3. Существует ли эпигенетика?

    Изменения в нуклеотидной последовательности, приводящие к фенотипическим вариантам, ясны, установлены и составляют саму основу неодарвиновского синтеза, который объединил дарвиновские теории вариации и отбора с правилами наследования Менделя.Что было и остается волшебным в эпигенетике, так это то, что можно увидеть существенные вариации без очевидных основных изменений в последовательности нуклеиновых кислот, и поэтому такие изменения относительно нестабильны. Первое, что привлекло внимание к эпигенетическому наследованию, так это различное поведение идентичных геномов в пестроте в результате косупрессии, которая инактивирует дублированные копии генов в растениях, эффекты положения дрозофилы, вызванные гетерохроматином [15], или соматический мозаицизм из-за инактивации Х-хромосомы. у самок млекопитающих.Эти различия в фенотипах не были бы удивительными, если бы они были обусловлены различиями в последовательности ДНК.

    Но насколько тщательно мы проверяли идентичность последовательностей в этих случаях? Представьте себе гипотетическую ситуацию. Что, если для создания центромеры требуется фермент (центромера?), Чтобы разрезать ДНК и вставить определенную последовательность, необходимую и достаточную для установления активности центромеры? Что, если бы неоцентромеры были случаями редкой случайной экспрессии и активности центромеразы? Что, если потеря центромерной активности в дицентрических Робертсоновских хромосомах слияния была доказательством обратимости центромеразы? Гипотетическое существование центромеразы, конечно, не нужно, учитывая то, что мы знаем о центромерных гистонах и структуре хроматина, но показательно, что во многих случаях специфический индуцированный полиморфизм даже не рассматривается.Мы придерживаемся мнения, что случайная мутация — единственный механизм, позволяющий изменять последовательность ДНК, и поэтому быстрые, индуцированные и обратимые изменения поведения хромосом должны происходить без изменения последовательности. Но это предполагает более четкие линии в определении «последовательности», чем существуют на самом деле, и игнорирует многие хорошо установленные наблюдения.

    Рассмотрим переключение типа спаривания у Schizosaccharomyces pombe. Переключение происходит, когда тихая кассета информации из локуса «хранения» передается в активный локус типа спаривания [16–18].Механизм переключения требует метки, вероятно, разрыва или рибонуклеотида на одной цепи [19]. Прослеживание происхождения этой цепи показало, что измененная цепь происходит из переключенного локуса в предыдущем поколении. В результате переключение ограничено по частоте и направлению. Рибонуклеотид в цепи дезоксирибонуклеиновой кислоты действительно является удивительным способом передачи информации о хромосоме, но, тем не менее, он является генетическим: он наследуется и является следствием. И что самое удивительное, это индуцируется.

    Рассмотрим также геномный импринтинг у млекопитающих. Действительно ли геномный импринтинг эпигенетичен? Хотя это, пожалуй, наиболее приемлемая форма эпигенетики, можно утверждать, что это не так, по тривиальным номенклатурным причинам: считаете ли вы 5-метилцитозин как цитозин или как пятое основание, которое просто требует дополнительного включения (связанное с репликацией ДНК-метилтрансфераза)? Хотя ваш ответ может кое-что рассказать о вашей философии, он влияет на то, как мы думаем об эпигенетических механизмах.Если считать 5-метилцитозин пятым основанием, то материнские и отцовские аллели геномно импринтированных генов действительно полиморфны. Можем ли мы также считать полиморфизмом дегидроксилирование или дегликозилирование? Рассмотрение этих случаев индуцированного полиморфизма исключило бы как переключение типа спаривания S. pombe, так и импринтинг в локусе Medea (где метилирование цитозина вызывает разрыв цепи на одном гомологе, облегчая его от сайленсинга) как эпигенетические. И почему бы нет? Селеноцистеин — это аминокислота, хотя рибосома требует обширной сложной системы для ее включения [20, 21].Метилцитозин химически и генетически отличается от цитозина; для его включения требуется лишь обширная и продуманная система. Разорванная цепь ДНК снова химически и генетически отлична. Это забавный аргумент, но он кажется чрезмерно надуманным и ненужным и, вероятно, немного странным. Дело не в том, что нам нужно удалить эти случаи из списка эпигенетики, а скорее в том, что мы должны учитывать, что мы подразумеваем под «последовательностью», когда используем ее в качестве ключевого критерия, отличающего «эпигенетику» от «полиморфизмов».«В этой серой зоне много ландшафта.

    4. Что-то среднее между

    Понимание того, как и почему мы определяем «последовательность» и «эпигенетичность», важно при классификации способов регуляции генов. Но такие соображения также раскрывают понимание того, как эти явления могут взаимодействовать, и заставляют нас задуматься о том, насколько важным может быть индуцированный полиморфизм в эволюции. Вышеприведенные примеры — Medea, тип спаривания и импринтинг — все это случаи индуцированного полиморфизма, который приводит к изменениям генетической активности последовательности.Тот факт, что они «независимы от последовательности», является артефактом нашей систематической ошибки ACGT-последовательности. Тем не менее, кажется сомнительным, что эти несколько примеров сами по себе опровергают наши взгляды на эволюцию. Во-первых, такие способы эпигенетической регуляции генов, по-видимому, необычны. Подсчитано, что у млекопитающих есть, возможно, сотни импринтированных локусов, а у растений всего лишь один. Во-вторых, это не случаи наличия / отсутствия генетических путей, а скорее смещения экспрессии различных аллелей, и поэтому сиблинги не отличаются заметно из-за этого способа регуляции; импринтированные гены по существу гаплоидны и поэтому мало чем отличаются от сцепленных с полом генов с точки зрения эволюции.В-третьих, они сбрасываются через одно поколение. Поэтому трудно представить, что эти формы эпигенетического наследования движут эволюцией глубоким или новым образом.

    Существуют ли примеры индуцированного полиморфизма, которые являются широко распространенными, последовательными и долгоживущими и поэтому могут повлиять на эволюцию генома?

    Почти половина геномов многих популярных многоклеточных животных высоко полиморфны, но эти полиморфизмы остаются незамеченными при общегеномных ассоциациях, локусах количественных признаков и популяционных генетических исследованиях.Эта часть, гетерохроматин — альфоидные и бета-повторы, мобильные элементы, сателлиты, повторяющаяся последовательность и так далее, обычно связанные с центромерами — не поддаются нашим современным подходам к геномике. Гетерохроматин может содержать сотни, тысячи и даже миллионы копий простых (например, AATAT, AAGAG и AAGAGAG) повторов [22–26]; следовательно, они не могут быть легко клонированы, секвенированы или собраны с использованием методов, направленных на секвенирование всего генома. Фактически, определение «целого» было изменено, чтобы игнорировать эту половину генома [27–29].Количественная оценка числа копий повторов является обременительной и неточной, и наткнуться на редкие полиморфизмы последовательностей в гомогенных блоках сателлитной ДНК — это удача [30]. Поэтому трудно оценить степень различий или скорость полиморфизма в этой значительной части генома.

    Гетерохроматин был впервые описан Эмилем Хайцем в 1920-х и 1930-х годах. В то время его отличительной чертой было гетеропикнотическое окрашивание, которое до сих пор, возможно, является лучшим определением.Впоследствии было обнаружено, что гетерохроматин обычно поздно реплицируется, репрессивен для экспрессии генов и обогащен специфическими модификациями ДНК и гистонов, которые его упаковывают, хотя есть исключения для всех этих особенностей [15, 31, 32]. Все согласны с тем, что гетерохроматин легко образуется на сильно повторяющейся последовательности и существует в виде комплекса с белками гетерохроматина (например, гистоновыми метилтрансферазами, HP1 и, возможно, РНК). Генетические и мутационные манипуляции, которые изменяют количество повторяющейся последовательности или белковых компонентов, демонстрируют естественный баланс между последовательностью и белковыми компонентами при формировании гетерохроматина [33–37].Избыточная последовательность ставит под угрозу образование гетерохроматина в другом месте, конкурируя за ограниченные белки гетерохроматина. Увеличение или уменьшение белков гетерохроматина увеличивает или уменьшает легкость образования гетерохроматина или увеличивает или уменьшает количество последовательности, которая может быть упакована как гетерохроматин.

    Малик и Хеникофф описали свой взгляд на конкретный пример эволюционного баланса в центромерном хроматине (или «центрохроматине») [38-40]. Они предполагают совместную эволюцию расширения последовательности и связывания ДНК с помощью центромерного гистона Cid.Избыточная центромерная ДНК связывается с Cid, и изменения в связывании (или экспрессии) Cid приводят к изменению центромерной последовательности. Это может быть примером более широкого механизма расширения и сжатия, ограниченного (или обнародованного) характеристиками ДНК-связывающих белков, которые стабилизируют повторяющуюся последовательность. Смесь множественных полиморфных простых повторов в геноме [25, 26, 41, 42] может быть стабилизирована смесью выделенных или перекрывающихся белков гетерохроматина [43–48]. Баланс между последовательностями и белками, которые вместе образуют гетерохроматин, как ожидается, будет важным, потому что белковые компоненты гетерохроматина играют двойную роль в качестве общих регуляторов транскрипции [49, 50].Гены переключаются между «гетерохроматиноподобными» и «эухроматиноподобными», когда они переключаются между молчанием и экспрессией во время развития или в ответ на стимулы окружающей среды. Мутации в генах, кодирующих эти белковые компоненты, часто действуют доминантно, что позволяет предположить, что их доза имеет значение [34, 36]. Легко представить себе трехсторонний баланс между гетерохроматиновой последовательностью, гетерохроматиновыми белками и механизмами регуляции эухроматических генов. Это предсказывает, что полиморфизм числа копий гетерохроматин-образующей последовательности может влиять на регуляцию генов по всему геному.

    Было очень сложно проверить, являются ли полиморфизмы числа копий последовательными, потому что существует несколько молекулярно-генетических инструментов, которые позволяют манипулировать числом копий в других изогенных фонах. Из классических исследований на Drosophila, где ДНК и белковые компоненты гетерохроматина легко манипулировать, мы знаем, что количество гетерохроматиновой последовательности в клетке резко влияет на сенсибилизированные гены вариегатности [33, 51, 52]. В крайнем случае, несколько лишних гетерохроматиновых хромосом смертельны [53].Хотя причина остается неясной, можно представить себе такое нарушение баланса между последовательностями и белками, которое вызовет массовую неправильную регуляцию многих генов. Y-хромосомы, захваченные из диких популяций, различаются по своей способности влиять на вызванное гетерохроматином изменение положения и экспрессию эухроматических генов в другом месте генома [54–56], но при этом содержат очень мало генов, кодирующих белок [57–59], что убедительно свидетельствует о том, что гетерохроматин полиморфизмы, возможно, полиморфизмы числа копий, влияют на экспрессию генов по всему геному.Наша работа вызвала изменение количества копий в одном повторе, рибосомной ДНК (рДНК) [60]. РДНК имеет прецедент для фенотипической изменчивости растений, вызванной помещением [61, 62], но, не будучи способной вызвать изменения в рДНК, было трудно проверить этот феномен в дальнейшем. У мух, однако, индуцированная вариация числа копий имеет последствия для индуцированного гетерохроматином вариэгации эффекта положения и экспрессии генов по всему геному [63, 64]. Эти вариации в регуляции генов перекрываются с вариациями, наблюдаемыми в изолированных природных Y-хромосомах [54, 64], предполагая, что значительная часть естественной вариации числа копий повторов рДНК [65, 66] может вносить вклад в фенотипическую вариативность в естественных популяциях.Не менее важно, что большая часть дисперсии, которая отображается на Y-хромосоме, не отображается на рДНК, предполагая, что большая часть фенотипической дисперсии отображается на другие последовательности на Y, возможно, на другие повторы, которые менее экспериментально поддаются манипулированию.

    Естественные вариации числа копий повторяющейся последовательности могут играть роль в эволюции, но уникальная динамическая биология рДНК предполагает более захватывающую возможность. Изменения в количестве копий могут быть вызваны и унаследованы.

    РДНК содержит перемежающиеся активные и неактивные гены рРНК и, таким образом, содержит характеристики как эухроматина, так и гетерохроматина в некоторых клетках.Физическим проявлением огромной экспрессии и процессинга рРНК является ядрышко. Стабильность этих длинных участков прямых повторов в ядре, вероятно, обусловлена ​​гетерохроматической упаковкой подмножества повторов. Пенг и Карпен наблюдали множественные ядрышки в постмитотических клетках животных, несущих мутации генов супрессоров пестроты, которые кодируют белковые компоненты гетерохроматина и регулируют рДНК [67]. Их результаты предполагают, что повторяющаяся последовательность, не упакованная как гетерохроматин, нестабильна и склонна к повреждению / репарации или внутрихромосомной рекомбинации.Наши эксперименты показали, что мутация генов-супрессоров пестролистности приводит к дестабилизации и снижению числа копий рДНК через митоз [63]. Мы далее количественно оценили потерю в соме, а также показали, что потеря наблюдалась через зародышевую линию, что привело к постоянному снижению количества копий рДНК в популяции после воздействия мутации, которая нарушает образование гетерохроматина. Недавно мы показали, что мутация репрессора экспрессии рДНК (CCCTC-Factor, или CTCF) также дестабилизирует рДНК, приводя к необратимой потере [68].Эти результаты согласуются с гетерохроматиноподобным замалчиванием, стабилизирующим повторяющуюся последовательность ДНК, и балансом между повторяющимися последовательностями и белковыми компонентами, которые их регулируют.

    У дрозофилы рибосомная ДНК является неотъемлемой частью, потому что ее динамизм не имеет себе равных. Это наиболее экспрессируемый набор генов в геноме [69], координирует активность всех трех полимераз, естественным образом сокращается за счет образования внехромосомных кругов [70], может восстанавливаться посредством мейотического увеличения или соматического псевдомагнетизма [71–75]. , и может компенсировать свой выход за счет изменения скорости удлинения и, возможно, скорости инициирования [76, 77].Он обладает соседними копиями, которые обладают гетерохроматической и эухроматической структурами хроматина [76, 78–80]. Как центральный орган в способности к синтезу белка, он также реагирует на статус питания, чувствителен к токсинам и лекарствам и подвержен нестабильности из-за изменений продуктов генов, необходимых для его регуляции [81–87]. Изменение регуляции рДНК посредством мутации или лечения лекарствами влияет не только на выход рРНК, но и на стабильность [88–90]. Следовательно, изменение активности белкового компонента гетерохроматина может повлиять на количество копий последовательности, с которой он связывается.

    Динамизм (рДНК) и баланс (гетерохроматиновой последовательности и белков) создают ситуацию гомеостаза гетерохроматина (рис. 2). Последовательности защищены от потери за счет упаковки в виде гетерохроматина. Потеря белка (или снижение активности белка, стрелка «а») дестабилизирует повторяющуюся ДНК (белое состояние) и приведет к потере, восстанавливая равновесие (стрелка «b» в серое состояние). Точно так же избыточная последовательность будет возвращаться через потерю, если не будет достаточного количества белка, чтобы упаковать ее для стабильности.Но избыток белка имеет последствия, поскольку любой гетерохроматиновый белок, не связанный в конститутивной последовательности, будет изменять экспрессию гена по всему геному (темно-серое состояние), благоприятствуя либо снижению экспрессии / активности белка (стрелка «c»), либо увеличению повторяющейся последовательности (стрелка «Г») для восстановления баланса (светло-серые состояния). В целом, нестабильность повторяющейся последовательности и следствие избытка гетерохроматиновых белков создает множественные состояния, которые уравновешивают факторы и естественным образом приводят к уравновешиванию количества повторяющихся последовательностей и экспрессии белка.Конечно, можно ожидать, что любые внешние факторы, влияющие на активность белка гетерохроматина, приведут к индуцированным и наследственным изменениям в количестве повторяющихся копий ДНК. РДНК особенно чувствительна к индуцированному полиморфизму числа копий, поскольку на него влияет статус питания на протяжении всей жизни организма, а число копий рДНК превышает то, что требуется для трансляции, что позволяет некоторую пластичность числа копий без чрезмерных недостатков.

    На первый взгляд, индуцированный полиморфизм числа копий похож на эпигенетическую модификацию (особенно если невозможно легко секвенировать и собрать повторяющиеся ДНК), а способность повторяющихся последовательностей изменять число копий относительно легко добавляет степень летучести, характерную для эпигенетическая регуляция генов.В отличие от многих форм трансгенерационных эффектов регуляции генов, индуцированные полиморфизмы числа копий связаны с хромосомами и, таким образом, являются как наследуемыми, так и селектируемыми. В отличие от эпигенетической регуляции импринтированных или инактивированных хромосом, индуцированный полиморфизм числа копий может быть унаследован от нескольких поколений. Но, как и трансгенерационные и эпигенетические эффекты, роль индуцированного полиморфизма только начинает рассматриваться в эволюции. Такое исследование, вероятно, будет выполнено на простых организмах, таких как Drosophila, которые имеют относительно простую архитектуру рДНК [91, 92].Напротив, у людей есть несколько массивов рДНК, которые часто меняются в размере [93], и сложная регуляция, которая делает одни массивы активными, а другие неактивными, означает, что может пройти некоторое время, прежде чем мы поймем, как полиморфизмы рДНК и нестабильность рДНК [94] вносят вклад в фенотип. различия в человеческой популяции или этиологии болезни.

    5. Является ли рДНК особенной?

    Индуцированный полиморфизм числа копий рДНК предлагает удобный механизм, с помощью которого изменения могут быть унаследованы, хотя здесь применимы те же возражения, что и в отношении вызванных окружающей средой изменений в экспрессии генов, которые вытягивают шею Ламарка: как это влияет на зародышевую линию? В случае индуцированного полиморфизма половые клетки могут быть более, а не менее чувствительны к индуцированным изменениям в составе гетерохроматина по трем причинам.Во-первых, во многих случаях экспрессия генов в этих типах клеток ограничена. Устойчивость белков гетерохроматина или наличие достаточного количества генного продукта, способного выдержать колебания активности гена, может быть меньше в этих типах клеток. Во-вторых, по крайней мере, у мужчин геном лишен большинства компонентов соматического хроматина в пользу упаковки белков и полиаминов. Это может повысить чувствительность таких хромосом к перестройкам ДНК или специфически пометить некоторые области для гипервариабельности. В-третьих, половые клетки естественным образом подвергаются рекомбинации с высокой скоростью.Хорошо известно, что изменения в микросателлите и количестве копий рДНК происходят в мейозе, в то время как одни и те же последовательности относительно стабильны в митозе. Задача состоит в том, чтобы понять, что идентифицирует ген как «чувствительный к количеству копий рДНК», потому что это будут те гены, которые выбраны для фенотипической изменчивости в ответ на изменение количества копий рДНК.

    Мы еще не понимаем, отличаются ли повторяющиеся последовательности от «неэкспрессированных» последовательностей способностью вызывать изменения, но мы знаем из мутационного и молекулярного анализов, что «гетерохроматин» не является монолитным и более точно рассматривается как множественный ». цвета »[95].Мутации могут влиять на один цвет гетерохроматина, но не на другой [96]. Пять пронумерованных цветностей значительно расширяют наше понимание структуры хроматина, но даже эти пять, вероятно, все еще являются упрощением, вызванным нашей неспособностью разрешить более тонкие различия. Громоздкая работа обнаружила изменения числа копий повторяющейся последовательности в нескольких исследованиях, предполагая, что это может быть очень широко распространенной формой генетической изменчивости [66, 97, 98]. Peng и Karpen показали увеличение очагов репарации повреждений ДНК в гетерохроматине мутантов супрессоров пестролистности в диплоидных клетках [99, 100].Они не идентифицировали репарируемые последовательности, но количество и распределение очагов репарации в ядрах указывало на то, что они не были сгруппированы (т.е. ограничены массивами рДНК). Это наблюдение предполагает, что гетерохроматин, образованный на простых повторах (а не только на высокоэкспрессируемой рДНК), также стабилизируется за счет упаковки в виде гетерохроматина. По мере того, как мы понимаем, что такое гетерохроматин, и по мере того, как становятся доступными инструменты для его более хирургического исследования, мы можем начать распутывать сложные взаимодействия между типами гетерохроматина, когда они изо всех сил пытаются держать друг друга под контролем или объединяться, чтобы отбиваться от общих врагов.

    Термин «эпигенетика» может сохранять свои строгие определения связанной с хромосомами генетической информации, не основанной на последовательности, или он может быть расширен за счет включения индуцированных мутаций или генных регуляторных сетей, которые влияют на последующие поколения. В конце концов, все формы регуляции являются генетическими и поэтому важны для понимания того, как сложные, плейотропные и эпистатические генетические взаимодействия способствуют созданию фенотипов. Каким бы ни было определение эпигенетики, наследие состоит в том, что мы не можем понять всеобъемлющий синтез сил, управляющих эволюцией генома, без понимания того, как регулируются все аллели в этом геноме.

    Границы | Изучение влияния однонуклеотидных полиморфизмов на трансляцию

    Вариация последовательности и экспрессия гена

    За последние два десятилетия достижения в области секвенирования генома предоставили беспрецедентный доступ к ландшафту генома человека и позволили документировать вариации последовательностей среди людей. Люди разделяют 99,5% идентичности на уровне геномной последовательности, что означает, что результирующее фенотипическое разнообразие проистекает из оставшейся разницы в 0,5%, а также эпигенетических модификаций.Различия в последовательностях возникают из-за присутствия тандемных повторов с коротким и переменным числом, инсерционных или делеционных полиморфизмов и однонуклеотидных полиморфизмов (SNP) (Mccarroll et al., 2006; Orr and Chanock, 2008). Среди SNP переходы (A ↔ G или C ↔ T) более распространены, чем трансверсии (A ↔ C или T; и G ↔ C или T). В геноме имеется не менее 10 миллионов SNP, встречающихся примерно через каждые 100–300 пар оснований и с частотой аллелей более 1%, что делает их, безусловно, наиболее распространенным типом вариантов в геноме человека (Risch, 2000; Lander et al. ., 2001; Орр и Чанок, 2008). В последнее время наблюдается расцвет исследований общегеномных ассоциаций (GWAS), в которых распространенность конкретных SNP связана с фенотипами или заболеванием (Srinivasan et al., 2016). Кроме того, Атлас ракового генома (TCGA) выявил вариации последовательности между опухолевыми и нормальными клетками, и текущая проблема заключается в различении тех мутаций, которые оказывают влияние на экспрессию генов, чтобы управлять эволюцией опухоли, и нерелевантными мутациями-пассажирами.

    Мутации могут изменять все стадии экспрессии генов в зависимости от их геномного местоположения.Когда они присутствуют в элементах регуляции транскрипции, они могут влиять на экспрессию мРНК. Возникая в генах, SNP могут влиять на сплайсинг мРНК, ядерно-цитоплазматический экспорт, стабильность и трансляцию. Когда они присутствуют в кодирующей последовательности и приводят к замене аминокислоты (называемой несинонимичным SNP или мутацией), они могут изменять активность белка. Если мутация синонимична (т.е.не изменяет природу аминокислоты), это может повлиять на скорость трансляции или период полужизни мРНК.Если мутация вызывает преждевременный стоп-кодон, это может привести к продукции усеченного белкового продукта или почти нулевого фенотипа из-за нонсенс-опосредованного распада (Mendell and Dietz, 2001; Nicholson et al., 2010). Проект «Энциклопедия элементов ДНК» (ENCODE) направлен на выявление и каталогизацию функциональных элементов в геноме человека и оказался весьма полезным для понимания потенциального воздействия вариаций последовательностей на экспрессию генов (Consortium, 2012). Однако функциональные последствия вариантов последовательности, которые встречаются в 5′-лидере мРНК [i.е. область перед кодоном инициатора основной открытой рамки считывания (ORF)] и 3′-нетранслируемые области (UTR) (т.е. область ниже основного стоп-кодона ORF) не всегда сразу очевидны и часто не охарактеризованы. . Здесь мы предлагаем некоторые мысли о том, как такие варианты могут влиять на эффективность трансляции мРНК. Мы выделяем отдельные этапы трансляции, на которые могут влиять варианты последовательностей, приводя примеры выбора, когда это уместно, и они суммированы в таблице 1.

    ТАБЛИЦА 1. Краткое изложение SNP, описанных в этом исследовании.

    Обзор eIF4F-зависимого рекрутирования рибосом

    Синтез белка млекопитающих преимущественно регулируется на стадии инициации трансляции, причем лимитирующей стадией является рекрутирование рибосом в мРНК (Figure 1A; Sonenberg and Hinnebusch, 2009). Ключевым посредником на этом этапе является комплекс eIF4F. Субъединица eIF4E связывается со структурой кэпа мРНК, присутствующей на всех цитоплазматических мРНК эукариот. Компонент eIF4G имеет РНК-связывающие домены и стабилизирует взаимодействие eIF4E: cap (Marcotrigiano et al., 2001; Янагия и др., 2009). Структурные элементы РНК разрешаются геликазой РНК-геликазы eIF4A DEAD-box в сочетании с белками, связывающими РНК, eIF4B и / или eIF4H (рис. 1A). Комплекс предварительной инициации 43S (40S рибосома и ассоциированные факторы) (PIC) затем рекрутируется в матрицу мРНК посредством мостиковых взаимодействий между eIF4G и связанным с рибосомами eIF3 (Sonenberg and Hinnebusch, 2009). Этот режим инициации называется cap- или eIF4E-зависимым. Потребность мРНК в eIF4F для рекрутирования рибосом различается и, по-видимому, масштабируется как следствие вторичной структуры 5′-лидера (Pickering and Willis, 2005; Bitterman, Polunovsky, 2015; Hinnebusch et al., 2016). Поскольку считается, что eIF4E является ограничивающим для трансляции, мРНК должны конкурировать за доступ к eIF4F, а мРНК со структурными барьерами в их 5′-лидерной области находятся в невыгодном положении (Pelletier and Sonenberg, 1985; Babendure et al., 2006). Следовательно, изменение ландшафта вторичной структуры в 5′-лидерной области мРНК может существенно влиять на эффективность трансляции, влияя на скорость рекрутирования рибосом (Pelletier et al., 2015). После связывания 43S PIC сканирует 5′-лидерную область мРНК в поисках инициирующего кодона.

    РИСУНОК 1. Обзор набора и сканирования рибосом. (A) Cap-зависимая инициация трансляции. Комплекс eIF4F в сочетании с eIF4B и eIF4H служит для подготовки мРНК для привлечения 43S рибосомного комплекса. (B) Влияние uAUG и uORF на сканирование рибосом. При связывании с мРНК 43S PIC (светло-синий) сканирует мРНК в поисках инициатора AUG. Кодон AUG в благоприятном контексте эффективно распознается сканирующей субъединицей 40S, в этот момент субъединица 60S присоединяется и начинается удлинение.Мутации, создающие новые uAUG или uORF, будут влиять на частоту рибосом, которые инициируются в основном кодоне ORF AUG. Положение uORF относительно основного кодона AUG важно для определения основного использования AUG, поскольку расстояние от стоп-кодона uORF и основного AUG определяет время, которое потребуется рибосоме для повторного приобретения eIF2 * GTP. тройной комплекс Met-тРНК. (C) A G / A SNP в 5′-лидерной области мРНК ERCC5 контролирует экспрессию и ответ на стресс.Аллель A, содержащий мРНК, имеет дополнительную uORF, которая обеспечивает более эффективную трансляцию основной ORF ERCC5 в ситуациях, когда eIF2α фосфорилируется. Подробности см. В тексте.

    Второй механизм, с помощью которого 43S PIC может быть рекрутирован в матрицы мРНК, заключается в прямом внутреннем связывании в пределах 5′-лидерной области с внутренним сайтом входа в рибосомы (IRES), устраняя потребность в структуре кэпа. Среди них лучше всего охарактеризованы вирусные IRES, которые были разделены на четыре класса на основе структурного сходства, фактора инициации и / или требований к транс-действующему фактору IRES (Mailliot and Martin, 2018).Некоторые исключительные IRES, такие как вирус паралича сверчка IRES, обходят необходимость в каких-либо факторах инициации и могут напрямую связываться с рибосомой.

    Открытие и характеристика IRES в клеточных мРНК представляет значительный интерес, поскольку они участвовали в обеспечении возможности трансляции в условиях, когда кэп-зависимая трансляция нарушена, таких как стресс, апоптоз, ограничение питательных веществ и митоз (Komar and Hatzoglou, 2015). Таким образом, считается, что функция клеточного IRES важна для обеспечения быстрой адаптации к быстро меняющейся среде, что приводит к избирательным трансляционным эффектам.Влияние SNP на клеточную активность IRES может повлиять на реакцию на стресс, такой как гипоксия, тепловой шок, токсины или лекарства (химиотерапия). Кроме того, мутации в клеточных IRES могут приводить к аберрантным трансляционным ответам, вызывающим ряд патологических расстройств, начиная от аутоиммунных заболеваний, нейродегенерации и рака (Holcik and Sonenberg, 2005).

    Изменения во вторичной структуре, влияющие на трансляционный вывод

    Препятствуя взаимодействиям eIF4F-cap или сканированию рибосом, структурные особенности (например,g., стебель-петли, комплексы РНК-белок, G-квадруплексы) могут действовать как барьеры для инициации трансляции и отрицательно влиять на эффективность трансляции (Pelletier and Sonenberg, 1985; Babendure et al., 2006). Исследование Shen et al. (1999) был одним из первых, кто задокументировал обширное влияние, которое SNP могут оказывать на вторичную структуру мРНК (Таблица 1). Анализ двух SNP в кодирующих областях мРНК, кодирующих аланил-тРНК-синтетазу и репликационный белок А, выявил аллель-специфические структурные особенности, которые влияют на доступность последовательностей.Доказательства того, что такие изменения могут влиять на трансляционный выход, были предоставлены исследованием, оценивающим влияние структур G-квадруплексов, присутствующих в 5′-лидерных регионах, на трансляцию (Beaudoin and Perreault, 2010). SNP (изменение G на C) был идентифицирован в положении 7 G-квадруплекса (критическая область для образования G-квадруплекса) в 5′-лидере мРНК AASDHPPT (аминоадипат-полуальдегиддегидрогеназа-фосфопантетеинилтрансфераза) (Beaudoin и Perreault, 2010). Биофизические эксперименты показали, что образование G-квадруплексов было нарушено, и это было связано с 1.5-кратное увеличение уровня белка в клетках без влияния на уровень мРНК (Beaudoin and Perreault, 2010). Эти эксперименты показывают, что точечные мутации в 5′-лидерных областях, которые изменяют вторичную структуру, могут влиять на трансляцию.

    Вторичная структура, расположенная непосредственно после AUG, также может влиять на трансляционный вывод. Например, синонимичный SNP от A до G в кодоне Leu , присутствующий в кодирующей области мРНК катехол- O -метилтрансферазы ( COMT ), был идентифицирован у субъектов с высокой болевой чувствительностью и с повышенным риском развивающееся заболевание височно-нижнечелюстного сустава (Дьяченко и др., 2005; Nackley et al., 2006). Белок COMT отвечает за деградацию катехоламинов и является регулятором восприятия боли. У человека три основных гаплотипа образованы четырьмя SNP в локусе COMT : один расположен в промоторе, а три — в кодирующей области [два синонимичных по his 62 his (C / T) и leu 136 лей, (C / G) и один несинонимичный val 158 met (A / G)] (Nackley et al., 2006). Сообщалось, что основные гаплотипы COMT различались в отношении локальной вторичной структуры мРНК с наиболее стабильной структурой, связанной с самыми низкими уровнями продукции белка (Nackley et al., 2006). Сайт-направленный мутагенез, нарушающий структурный элемент, вызывает увеличение продукции белка. Однако авторы не оценивали напрямую влияние различных последовательностей гаплотипов на скорость трансляции мРНК.

    Напротив, вторичная структура может также действовать для увеличения узнавания стартовых кодонов, когда она соответствующим образом расположена ниже инициирующих кодонов — эффект, предположительно, из-за замедления сканирования рибосом и увеличения времени выборки кодонов (Kozak, 1991). Следовательно, изменения последовательности, которые увеличивают образование структуры в проксимальной области нижестоящего AUG, могут увеличивать степень использования AUG.

    Вариация 5′-лидерной последовательности и выбор стартовой площадки

    SNP влияют на распознавание стартового кодона

    Механизм, с помощью которого PIC 43S обнаруживает инициирующий кодон, влияет на то, как SNP, которые генерируют новые или удаляют существующие стартовые кодоны, влияют на инициацию трансляции. Контекст последовательности инициирующего кодона диктует эффективность, с которой он распознается при сканировании 43S PIC (рисунок 1B). Оптимальным контекстом является A / GxxAUGg, называемая консенсусной последовательностью Козака, при этом пурин -3 (относительно A AUG) является наиболее важным детерминантом (Kozak, 1986, 1987a).Предполагается, что мутации, изменяющие этот контекст, повлияют на эффективность выбора стартовой площадки.

    Существует множество примеров мутаций, которые изменяют контекст последовательности AUG, чтобы влиять на эффективность трансляции. Одним из таких примеров является описание мутации в гене BRCA1 у 35-летнего пациента, превращающей G в C в положении -3 относительно инициирующего кодона BRCA1 AUG (Signori et al., 2001). Эта мутация изменяет оптимальный пурин на менее подходящий пиримидин и связана со спорадическим раком груди и яичников (Hall et al., 1990; Сабо и Кинг, 1995). In vitro и in vivo Исследования экспрессии репортерных мРНК, несущих аллель C, показали снижение экспрессии белка на 30–50% по сравнению с контрольными мРНК, несущими аллель G. Кроме того, транскрипт, несущий аллель G, был связан с более тяжелыми полисомами (и, следовательно, с повышенной скоростью трансляции) по сравнению с аллелем C, содержащим мРНК.

    База данных NCBI SNP была проанализирована на предмет наличия вариантов, охватывающих инициирующие кодоны AUG, с акцентом на положения -3 и +4 (Xu et al., 2010). Это исследование выявило SNP в> 45 генах, которые встречаются в одном из этих двух критических положений и, таким образом, потенциально могут влиять на использование AUG. Варианты двух генов были протестированы путем трансфекции репортерных конструкций в клетки и выявили, что мРНК, несущие SNP с «более слабой» или «более сильной» консенсусной последовательностью Козака, вызывают пониженные или повышенные уровни белка, соответственно (Xu et al., 2010). Никаких различий в уровнях мРНК не отмечено.

    SNP, создание внутрикадрового uAUG

    Мутации, которые генерируют стартовые кодоны выше и в рамке с основным инициирующим кодоном открытой рамки считывания, «улавливают» некоторые сканирующие 43S PIC и перенаправляют синтез белка в новый стартовый сайт для производства N-концевых удлиненных белковых продуктов (рис. 1B). см. «In-frame uAUG»).Эффективность, с которой это достигается, частично диктуется контекстом, окружающим новый инициирующий кодон.

    Одним из инструментов биоинформатики, который был разработан для категоризации эффектов вариантов на функцию генома, является SnpEff (Cingolani et al., 2012). Этот инструмент аннотирует варианты на основе местоположения генома, включая интронную, нетранслируемую область, сайт сплайсинга, межгенное, несинонимичное кодирование и т. Д. (Cingolani et al., 2012). Среди эффектов, перечисленных SnpEff, — изменения в кодонах инициации (AUG и менее распространенные кодоны CUG и UUG), которые происходят в 5′-лидерной области.Из 297 SNP, которые генерировали новый кодон инициации трансляции в 5′-лидерной области при сравнении двух штаммов Drosophila melanogaster , ~ 25% находились в той же рамке считывания, что и основная ORF (Cingolani et al., 2012), и вырабатывали N -концевально удлиненные полипептиды.

    SNP, создание uORF вне кадра с помощью основного ORF

    Если мутация генерирует новый стартовый кодон вне рамки с основной ORF AUG, некоторые PIC 43S могут инициироваться в новой восходящей (u) ORF и обходить основную ORF, что приводит к снижению продукции белка из основной продукт, кодируемый ORF (рисунок 1B и таблица 1).Степень изменения маршрута будет частично зависеть от контекста нового инициирующего кодона, а также от проксимальной вторичной структуры AUG (Kozak, 1991; Barbosa et al., 2013).

    В качестве примера такого сценария мутация зародышевой линии в гене β-глобина, расположенная на 26 нуклеотидов выше кодона инициатора AUG, приводит к созданию нового, выходящего за рамки рамки uAUG (Oner et al., 1991; Cai et al. др., 1992). Этот uAUG находится в благоприятном контексте последовательности (A в положении -3), и инициация в этих шунтах uAUG рибосомы проходят аутентичный AUG, снижая продукцию β-глобина и приводя к β-талассемии.Необходимо тщательно оценить, влияет ли на стабильность мРНК конкретная 5′-лидерная мутация, а также влияет ли она на фенотип.

    Сходный сценарий был задокументирован в гене GTP cyclohydrolase 1 ( GCh2 ), в котором гетерозиготные мутации связаны с Dopa-чувствительной дистонией (DRD) (Armata et al., 2013). Здесь переход зародышевой линии C в T, расположенный на 22 нуклеотида выше сайта начала трансляции, генерирует новый стартовый кодон, который находится вне рамки с нижележащим кодоном GCh2 и AUG, что приводит к снижению продукции GCh2 (Armata et al., 2013). Будет важно расширить эти результаты, чтобы: (i) формально продемонстрировать, что переход C в T приводит к трансляции вновь созданной нКОРС (оценка, которая может быть сделана с помощью отпечатка рибосом) и (ii) продемонстрировать, что переход C в T альтерация приводит к изменению выхода эндогенного белка GCh2.

    Влияние, которое этот класс мутаций может оказывать на биологию опухоли, является значительным и иллюстрируется идентификацией мутации зародышевой линии в гене-супрессоре опухоли CDKN2A , картирующем на 34 нуклеотида выше нормального сайта старта (Liu et al., 1999; Орлоу и др., 2007). В этом случае мутация G в T создает новый инициирующий кодон, находящийся в благоприятном контексте, но вне рамки с CDKN2A AUG. Таким образом, аллель T генерирует мРНК, которая продуцирует меньше CDKN2A и существенно увеличивает риск меланомы у носителей (Liu et al., 1999; Orlow et al., 2007).

    SNP, создающие uORF перед основной ORF

    Если присутствие SNP приводит к созданию нового uORF, это может повлиять на экспрессию гена: (i) влияя на эффективность повторной инициации в основной нижней рамочной рамке считывания и (ii) генерируя новый пептид, кодируемый uORF (Barbosa и другие., 2013). Точный механизм того, как 40S-рибосомы способны возобновить синтез белка после трансляции нКРС, не совсем хорошо определен, но он связан с длиной нКРС (чем длиннее нКОРС, тем менее эффективен процесс повторной инициации), а также с наличие структурных барьеров в uORF (что снижает потенциал повторной инициации) (рис. 1B; Kozak, 1987b; Abastado et al., 1991; Poyry et al., 2004). Считается, что факторы инициации, критические для повторной инициации, остаются связанными с рибосомами в течение некоторого времени после начала элонгации, но в какой-то момент теряются или выбрасываются из транслирующей рибосомы.Если прекращение трансляции происходит до того, как эти факторы потеряны, то эта рибосома сохраняет свою способность к повторной инициации (Poyry et al., 2004). Анализ 11649 согласованных измерений мРНК и белков из четырех опубликованных исследований на млекопитающих показал, что присутствие uORFs в 5′-лидерной области обычно связано со сниженной экспрессией из основной ORF (Calvo et al., 2009).

    Репрессивная природа вновь созданной uORF может частично происходить из-за пониженной эффективности, связанной с повторной инициацией трансляции по сравнению с de novo , cap-зависимой инициацией трансляции.Calvo et al. (2009) предприняли поиск вариантов нуклеотидов, изменяющих ORF, в пределах 12 миллионов SNP, присутствующих в dbSNP. Они обнаружили ряд новых и ранее описанных полиморфизмов, которые, по прогнозам, создают новые или удаляют существующие нКРС. Например, мутации в 5′-лидерной области мРНК SRY (Poulat et al., 1998) и SPINK1 (Witt et al., 2000) вводили новые uORF перед основной ORF. Тестирование репортеров с разными 5′-лидерами показало, что те, которые содержат uORFs, продуцируют меньше основного белка ORF по сравнению с репортерами, экспрессирующими контрольные 5′-лидерные последовательности дикого типа.В общем, возникновение новой uORF связано с 30-80% снижением синтеза белка из основной ORF (Calvo et al., 2009).

    Мутации, которые приводят к потере uORF, могут увеличить результат трансляции. Анализ 404 uORF, присутствующих в 5′-лидерах мРНК, кодирующих 83 тирозинкиназы и 49 других протоонкогенов в 308 злокачественных новообразованиях человека, выявил мутации uORF в генах EPHB1 и MAP2K6 (Schulz et al., 2018). В случае EPHB1 мутация изменила единственный uAUG, обнаруженный в 5′-лидере, на кодон GUG, в то время как единственный uAUG из MAP2K6 был изменен на кодон ACG.Обе идентифицированные мутации приводят к увеличению трансляции соответствующих мРНК. Это было дополнено компьютерным анализом данных секвенирования всего экзома из 464 раковых опухолей толстой кишки, который выявил соматические мутации, приводящие к потере 22 кодонов инициации uORF и 31 кодонов терминации uORF (Schulz et al., 2018).

    Было также показано, что присутствие uORF придает устойчивость к воздействию цисплатина за счет облегчения трансляции полипептида, кодируемого основной ORF, в стрессовых условиях (Somers et al., 2015; Рисунок 1С). Ген ERCC5 кодирует эндонуклеазу, которая расщепляет 3′-аддукты ДНК и требуется для эксцизионной репарации нуклеотидов. 5′-лидерная область мРНК содержит uORF. Существует полиморфизм G / A, rs751402, расположенный выше этого uORF, где мРНК, содержащая аллель A, имеет новую uORF, а мРНК, содержащую аллель G, нет. Обработка клеток цисплатином приводит к индукции стрессовой реакции, что приводит к фосфорилированию eIF2α и более длительной персистенции трансляции мРНК аллеля А (Somers et al., 2015). В то время как фосфорилирование eIF2α обычно связано с глобальным отключением синтеза белка, трансляционный выход некоторых мРНК парадоксальным образом увеличивается из-за конфигурации uORF в их 5′-лидерных областях.

    eIF2 необходим для образования тройного комплекса (с тРНК и GTP). Когда субъединица eIF2α становится фосфорилированной, образование тройного комплекса становится ограничивающим скорость, что приводит к глобальному отключению общей трансляции. Повторная инициация рибосомы после трансляции uORF должна привлекать de novo тройных комплексов и увеличение расстояния uORF до следующего нижестоящего кодона AUG дает больше времени для того, чтобы это событие произошло (Figure 1C).В случае мРНК, содержащей аллель ERCC5 A, создание uORF приводит к тому, что в условиях стресса большинство рибосом, завершивших трансляцию A-кодируемой uORF, не будут повторно приобретать другой тройной комплекс до того, как просканировали прошлое. uORF2 (и, следовательно, uORF2 не будет транслироваться), но сделает это до достижения ORF ERCC5 (рисунок 1C). Создание новых uORFs и их расположение в 5′-лидерной области может, таким образом, изменять то, как трансляция специфических мРНК реагирует на сигнальные сигналы.

    SNP, влияющие на область кодирования uORF

    Мутации, возникающие в кодирующей области uORFs, могут оказывать два типа эффектов на трансляцию — влияя на природу кодируемого регуляторного пептида и изменяя скорость элонгации.

    Если они нарушают функцию регуляторного пептида, участвующего в определении скорости повторной инициации рибосом, то они могут влиять на выход основной ORF. Так может быть G / A SNP в 5′-лидере мРНК трансформирующего фактора роста β3 ( TGFβ3 ) и присутствует у нескольких представителей обширной родословной с аритмогенной кардиомиопатией правого желудочка типа 1 (Beffagna et al., 2005). 5′-лидер мРНК TGFβ3 содержит 11 AUG, потенциально кодирующих 11 полипептидов (Arrick et al., 1991). G / A SNP не изменяет конфигурацию uORF, а скорее вызывает замену Arg на His в кодоне 36 uORF из 88 аминокислот, который находится вне рамки считывания и перекрывается с последовательностью основного AUG TGFβ3 . При тестировании в контексте анализа репортерной люциферазы в трансфицированных клетках миобластов C2C12 присутствие варианта A приводило к 2,5-кратному увеличению продукции люциферазы (Beffagna et al., 2005). Сходная ситуация была описана для гена рецептора серотонина, HTR3A , где C / T SNP, расположенный во втором uORF, вызывал изменение Pro на Ser у людей с биполярным аффективным расстройством (Niesler et al., 2001). Авторы проверили последствия этого SNP в анализе трансфекции на основе люциферазы и обнаружили, что аллель T вызывает 2,5-2,9-кратное увеличение экспрессии люциферазы без изменения уровней мРНК. Одна интерпретация этих результатов состоит в том, что кодируемый uORF пептид играет ингибирующую роль в трансляции, а изменение G на A снижает активность этого небольшого полипептида.В обоих вышеупомянутых исследованиях необходимо оценить потенциальные эффекты SNP на сплайсинг, чтобы исключить другие возможные объяснения наблюдаемых эффектов.

    Альтернативно, если варианты влияют на скорость элонгации uORF, то они могут влиять на возможность повторной инициации нижележащими кодонами AUG (Jackson et al., 2012; Gunisova et al., 2018). Считается, что замедление скорости удлинения рибосом, проходящих транзитом через uORF, увеличивает вероятность того, что факторы инициации, связанные с удлинением рибосом и необходимые для удлинения, будут высвобождены до завершения трансляции uORF.Затем это привело бы к снижению повторной инициации нижележащими кодонами AUG. Напротив, если скорости удлинения в uORF увеличиваются, это может привести к увеличению скорости повторной инициации и продукции белка из нижележащих ORF.

    5 ‘SNP и активность IRES

    Другой способ, с помощью которого изменения последовательности в 5′-лидерных областях, как было документально подтверждено, изменяют трансляцию, — это влияние на активность IRES. Сообщалось, что протоонкоген c-Myc ( MYC ) содержит IRES, который может вносить вклад в неправильную регуляцию трансляции MYC во время онкогенеза (Stoneley et al., 1998). Интересно, что точечная мутация в 5′-лидерной области MYC , приводящая к переходу от C к T, была идентифицирована в линии клеток множественной миеломы и ассоциирована с повышенными уровнями белка MYC (Paulin et al., 1998). 5′-лидер, несущий аллель Т, показал усиленное связывание нескольких связывающих РНК белков, что было выявлено подходами Северо-Западного блоттинга и УФ-перекрестного связывания. Такая же мутация C в T была обнаружена в 42% образцов первичной множественной миеломы и привела к созданию варианта IRES, который оказался более активным (Chappell et al., 2000). Механизм, лежащий в основе того, как изменение C / T может привести к изменениям в деятельности IRES, требует дальнейшего определения.

    5′-SNP, выбор сайта инициации транскрипции и альтернативный сплайсинг

    Однонуклеотидные полиморфизмы, присутствующие в регуляторных областях генов, могут влиять на фактор транскрипции, а также на связывание РНК Pol II (Kasowski et al., 2010). Если связывание РНК Pol II перенаправляется на вновь образованный сайт, это может привести к использованию альтернативных сайтов инициации транскрипции, генерируя мРНК с различными 5′-лидерными последовательностями, что может повлиять на скорость инициации трансляции.

    Вариация последовательности в 5′-лидерной области может также происходить за счет альтернативного сплайсинга мРНК для получения изоформ с различной эффективностью трансляции. Присутствие SNP, влияющих на альтернативный сплайсинг, может изменять уровни и природу образующихся изоформ мРНК. Например, тромбопоэтин ( TPO ) является главным регулятором мегакариопоэза и продукции тромбоцитов и находится под жестким трансляционным контролем. Его 5′-лидер имеет семь uORFs (Ghilardi et al., 1998). Был идентифицирован SNP, который увеличивает сывороточные уровни TPO у пациентов с наследственной тромбоцитемией (Wiestner et al., 1998), генетическое заболевание, вызванное повышенным уровнем тромбоцитов из-за устойчивой пролиферации мегакариоцитов (Murphy et al., 1997). В частности, трансверсия G → C в донорном сайте сплайсинга интрона 3 TPO отвечает за образование укороченного 5′-лидера, в котором uORF 7, а также основной AUG, теряются (Wiestner et al., 1998). Таким образом, инициация трансляции происходит на следующем нижестоящем AUG и приводит к полностью функциональному, хотя и усеченному, белку TPO , уровень которого намного выше, чем у нормальной мРНК.Этот эффект, по-видимому, является результатом повышенной трансляции, предположительно за счет воздействия на процесс повторной инициации, поскольку SNP не влияет на уровни РНК (Wiestner et al., 1998). Влияют ли SNP на сплайсинг или транскрипцию, можно оценить только с помощью характеристики последовательности 5′-лидерных областей мРНК, анализ, который слишком часто опускается.

    5′-SNP и сайты-мишени для связывания РНК-белка?

    Воздействие на сайты-мишени связывающих РНК белков — еще один способ, с помощью которого SNP могут влиять на трансляцию.Путем измерения соотношения полисомных и связанных с моносомами мРНК в иммортализованных лимфобластоидных клеточных линиях был предпринят полногеномный поиск SNP, влияющих на эффективность трансляции (Li et al., 2013). Это исследование показало, что SNP в 5′-лидерной области мРНК малого рибосомного белка S26 (rs1131017: C / G, расположенный на 22 нуклеотида выше кодона инициатора AUG) был связан с измененной продукцией белка. Репортерные мРНК, содержащие вариант G, продуцировали больше белка, чем мРНК, содержащие вариант C.Этот SNP находится в неравновесном сцеплении с локусом 12q13 для восприимчивости к диабету I типа. Он прерывает полипиримидиновый трек (…. -28 TCTCCT [C / G] TCTCC -17 …) перед кодоном rpS26 AUG. Меняет ли это связывание РНК-связывающего белка, такого как белок, связывающий полипиримидиновый тракт (который участвует в инициации трансляции), еще предстоит определить (Kaminski and Jackson, 1998).

    SNP и коэффициенты удлинения

    Информация, содержащаяся в мРНК, кодирующей протеом, зашифрована 61 возможным кодоном.Кодоны, кодирующие одну и ту же аминокислоту, декодируются родственными тРНК, которые не одинаково экспрессируются в клетках. Обычно считается, что скорость декодирования кодонов может варьироваться в зависимости от количества тРНК, и это может иметь драматические эффекты на скорость удлинения (Cannarozzi et al., 2010; Hanson and Coller, 2018). Это было подтверждено данными отпечатков рибосом и экспериментами, в которых выход трансляции был увеличен простой заменой редких кодонов на более частые (Gardin et al., 2014; Lareau et al., 2014; Hussmann et al., 2015; Weinberg et al., 2016). Однако считается, что редкие кодоны играют важную роль в клеточном гомеостазе, поскольку участки редких кодонов вызывают паузу рибосом во время удлинения, и это дает время для правильного сворачивания белка (Hanson and Coller, 2018). Таким образом, SNP, изменяющий редкий кодон на более распространенный, может, в принципе, увеличить выход белка, но снизить долю синтезируемого функционального (т.е. правильно свернутого продукта) полипептида.

    Примером, когда использование кодонов может влиять на активность белка, можно привести исследование, оценивающее влияние синонимичного SNP (C3435T), присутствующего в кодирующей области множественной лекарственной устойчивости 1 ( MDR1 ), на функцию белка (Kimchi-Sarfaty et al., 2007). Ген MDR1 кодирует управляемый АТФ насос оттока лекарств, который способствует устойчивости опухолевых клеток к лекарствам. SNP C3435T ранее был связан со снижением экспрессии и функции MDR1 в клетках человека (Hoffmeyer et al., 2000; Drescher et al., 2002). Этот SNP заменяет наиболее распространенный кодон Ile (AUC) на менее распространенный (AUU). Репортерные конструкции, содержащие варианты C или T, демонстрируют сходные уровни экспрессии белка, но продуцируют продукты с различной активностью (Kimchi-Sarfaty et al., 2007). Эксперименты по расщеплению трипсином показали, что продукт MDR1 из двух разных гаплотипов различается по чувствительности к протеазам, что указывает на различные конформации. Превращение Ile-кодона во все более редкий, AUA, генерировало мРНК, которая продуцировала белок MDR1 с еще меньшей активностью транспорта лекарств.

    Аналогичное явление наблюдалось для гена трансмембранного регулятора проводимости муковисцидоза ( CFTR ), в котором синонимичный SNP T2562G в кодирующей области, как было обнаружено, снижает уровни белка на 30%, не влияя на уровни мРНК или сплайсинг (Kirchner et al., 2017). Этот SNP изменил кодон треонина с широко распространенной последовательности ACU на более редкий кодон ACG. Вектор экспрессии CFTR , несущий аллель G, показал пониженную одноканальную функцию проводимости Cl по сравнению с вектором, экспрессирующим аллель T (Kirchner et al., 2017). Авторы пришли к выводу, что более низкая скорость синтеза мРНК, кодируемой аллелем G, приводит к неправильному сворачиванию белка, который нацелен на CFTR для деградации механизмом контроля качества (Kirchner et al., 2017). Сниженные уровни белка из мРНК аллеля G были спасены трансфекцией вектора экспрессии, управляющего синтезом SNP-соответствующей родственной тРНК (Kirchner et al., 2017).

    Вариация последовательности в 3 ‘Utrs, влияющая на трансляцию

    За исключением мРНК гистонов, клеточные мРНК имеют поли (A) хвосты на их 3′-конце. Поли (А) хвост важен для инициации трансляции, и его функция обеспечивается связывающим поли (А) белком, PABPC1. PABPC1 также взаимодействует с eIF4G на 5′-конце мРНК для создания замкнутой петли мРНК, которая, как считается, стимулирует трансляцию посредством: (i) стабилизации ассоциации eIF4F с кэпом, (ii) стимуляции связывания 60S рибосомной субъединицы и ( iii) увеличение эффективной концентрации терминирующих рибосом вблизи кэп-структуры.SNP, которые мутируют сигнал полиаденилирования, будут приводить к генерации изоформ с более длинными 3′-концами из-за использования нижележащих сайтов полиаденилирования (Thomas and Saetrom, 2012). Если расширенная последовательность приводит к приобретению новых сайтов связывания микроРНК (miRNAs), тогда регуляция новой изоформы мРНК может сильно отличаться от мРНК дикого типа (Sandberg et al., 2008).

    Также мутации, которые происходят в сайтах-мишенях miRNA и изменяют распознавание miRNA, могут оказывать влияние на экспрессию мРНК за счет снижения инициации трансляции и увеличения деградации мРНК (Mohr and Mott, 2015).За последнее десятилетие мы увидели обширный список SNP, которые отображаются на miRNA или их предполагаемые сайты связывания внутри мРНК, которые потенциально могут влиять на ответ miRNA, и они были всесторонне рассмотрены (Detassis et al., 2017; Moszynska et al., 2017). Например, SNP G к A был описан в miR-1269, miRNA, связанном с повышенным риском гепатоцеллюлярной карциномы (Min et al., 2017). SPATS2L и LRP6 кодируют проонкогенные активности и оба являются мишенями для miR-1269.Это исследование показало, что когда вариант miR-1269 A экспрессируется в клетках, репрессивный эффект на SPATS2L и LRP6 снижается по сравнению с вариантом miR-1269 G. Также были зарегистрированы SNP в сайтах-мишенях микроРНК на мРНК. Например, было обнаружено, что SNP от A до G в 3 ‘UTR мРНК TOMM20 связан с повышенным риском колоректального рака (Lee et al., 2016). Было установлено, что микроРНК miR-4273-5p отвечает за контроль уровней TOMM20 .

    Существует несколько примеров белков, связывающих РНК 3′-UTR, которые могут влиять на трансляцию мРНК; как на стадии инициации, так и на стадии удлинения (Szostak, Gebauer, 2013; Yamashita, Takeuchi, 2017). Лучшим примером является 4EHP (также известный как eIF4E2), белок, связывающий кэп, который, как известно, также взаимодействует со специфическими мРНК-связанными белками, присутствующими в 3′-UTR мРНК. Таким образом, 4E-HP образует структуру с замкнутой петлей, и, поскольку он не взаимодействует с eIF4G, это предотвращает рекрутирование рибосом в структуру кэпа и оказывает избирательное ингибирование трансляции мРНК (Morita et al., 2012; Шостак и Гебауэр, 2013; Chapat et al., 2017; Ямасита и Такеучи, 2017). SNP, влияющие на РНК-связывающие белки, которые взаимодействуют с 4EHP, могут приводить к изменениям экспрессии специфического набора 4EHP-чувствительных мРНК.

    Заключение

    Несмотря на то, что значительные усилия были приложены к поиску и аннотированию SNP, которые могут влиять на функцию белка с использованием таких программ, как SIFT (Kumar et al., 2009) и PolyPhen (Adzhubei et al., 2010; Li and Wei, 2015), существует признанная потребность в инструменте биоинформатики, который может прогнозировать потенциальные функциональные последствия SNP в 5′-лидерных и 3′-UTR мРНК (Kumar et al., 2014). Были достигнуты успехи (i) в отношении программного обеспечения, которое предсказывает эффекты SNP на мишени miRNA, с такими программами, как microSNiPer (Barenboim et al., 2010) и mrSNP (Deveci et al., 2014), (ii) идентификация инициации трансляции. сайты, использующие ATGpr, и (iii) программное обеспечение для прогнозирования ORF, такое как ORF Finder. Теперь необходимы такие инструменты, как SnpEff, которые могли бы связывать изменения в 5′-лидерных и 3′-UTR последовательностях с предсказаниями основной экспрессии ORF. Лучшее понимание переменных, участвующих в определении эффективности трансляции мРНК, поможет разработать алгоритмы с большей количественной предсказательной силой.

    Многое было извлечено из функционального анализа генетических вариантов в 5′-лидерах мРНК и их влияния на трансляцию. Большинство из них было идентифицировано, потому что они были связаны с наблюдаемым фенотипом. Поражения, эффекты которых легче всего предсказать, — это те, которые влияют на контекст инициирующих кодонов или приводят к генерации новых uAUG. Однако именно те эффекты, эффекты которых остаются необъясненными, вероятно, приведут к открытию новых биологических механизмов.Например, во время поиска онкогенных изменений, связанных с раком простаты, Wang et al. (2009) идентифицировали соматическую мутацию G в A, которая картировалась в лидерной области 5′-катенина, на девять нуклеотидов выше кодона AUG. Присутствие аллеля А в репортерных мРНК приводило к трех-семикратному увеличению экспрессии белка по сравнению с мРНК, несущими аллель G, без отмеченного влияния на уровни мРНК. Механизм, лежащий в основе этой трансляционной стимуляции, неизвестен, но указывает на очень интересную биологию.Это также подчеркивает необходимость тщательного рассмотрения функциональных последствий 5′-лидерных мутаций, обнаруженных крупномасштабными проектами секвенирования генома рака, и их потенциальной роли в влиянии трансляции. В настоящее время это сложно делать систематически из-за недостатка нашей способности предсказывать структурную сложность РНК, а также из-за недостатка знаний о ландшафте связывающих РНК белков (RBP) in vivo . Чтобы заполнить этот пробел, предпринимаются общегеномные подходы к зондированию структуры РНК, а также усилия, направленные на определение взаимодействия RBP (Castello et al., 2013; Tenzer et al., 2013; Bevilacqua et al., 2016; Бизоньо и Кин, 2018).

    Авторские взносы

    Все авторы подготовили и написали рецензию.

    Финансирование

    Исследования в лаборатории JP поддерживаются Канадскими институтами исследований в области здравоохранения (CIHR FDN # 148366).

    Заявление о конфликте интересов

    Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

    Сноски

    1. https://www.encodeproject.org/
    2. https://www.ncbi.nlm.nih.gov/projects/SNP/

    Список литературы

    Абастадо, Дж. П., Миллер, П. Ф., Джексон, Б. М., и Хиннебуш, А. Г. (1991). Подавление повторной инициации рибосом в вышележащих открытых рамках считывания в клетках с недостатком аминокислот формирует основу для контроля трансляции GCN4. Мол. Клетка. Биол. 11, 486–496. DOI: 10.1128 / MCB.11.1.486

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Аджубей, И.А., Шмидт, С., Пешкин, Л., Раменский, В. Е., Герасимова, А., Борк, П. и др. (2010). Метод и сервер для предсказания повреждающих миссенс-мутаций. Нат. Методы 7, 248–249. DOI: 10.1038 / nmeth0410-248

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Armata, I.A., Balaj, L., Kuster, J.K., Zhang, X., Tsai, S., Armatas, A.A., et al. (2013). Допа-чувствительная дистония: функциональный анализ однонуклеотидных замен в 5′-нетранслируемой области GCh2. PLoS One 8: e76975. DOI: 10.1371 / journal.pone.0076975

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Аррик Б. А., Ли А. Л., Гренделл Р. Л. и Деринк Р. (1991). Ингибирование трансляции мРНК трансформирующего фактора роста бета 3 ее 5′-нетранслируемой областью. Мол. Клетка. Биол. 11, 4306–4313. DOI: 10.1128 / MCB.11.9.4306

    CrossRef Полный текст | Google Scholar

    Барбоса, К., Пейшейро, И., и Ромао, Л. (2013).Регуляция экспрессии генов с помощью открытых рамок считывания и болезней человека. PLoS Genet. 9: e1003529. DOI: 10.1371 / journal.pgen.1003529

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Баренбойм, М., Золтик, Б. Дж., Го, Ю., и Вайнбергер, Д. Р. (2010). MicroSNiPer: веб-инструмент для прогнозирования эффектов SNP на предполагаемые мишени микроРНК. Гум. Мутат. 31, 1223–1232. DOI: 10.1002 / humu.21349

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Беффанья, Г., Occhi, G., Nava, A., Vitiello, L., Ditadi, A., Basso, C., et al. (2005). Регуляторные мутации в гене трансформирующего фактора роста-бета3 вызывают аритмогенную кардиомиопатию правого желудочка типа 1. Cardiovasc. Res. 65, 366–373. DOI: 10.1016 / j.cardiores.2004.10.005

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Бевилаква, П. К., Ричи, Л. Е., Су, З., и Ассманн, С. М. (2016). Полногеномный анализ вторичной структуры РНК. Annu. Преподобный Жене. 50, 235–266. DOI: 10.1146 / annurev-genet-120215-035034

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Cai, S.P., Eng, B., Francombe, W.H., Olivieri, N.F., Kendall, A.G., Waye, J.S., et al. (1992). Две новые мутации бета-талассемии в 5′- и 3′-некодирующих областях гена бета-глобина. Кровь 79, 1342–1346.

    Google Scholar

    Кальво, С. Э., Пальярини, Д. Дж., И Мутха, В. К. (2009). Открытые рамки считывания, расположенные выше по течению, вызывают повсеместное снижение экспрессии белка и являются полиморфными среди людей. Proc. Natl. Акад. Sci. США 106, 7507–7512. DOI: 10.1073 / pnas.08106

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Каннароцци, Г., Шраудольф, Н. Н., Фати, М., Фон Рор, П., Фриберг, М. Т., Рот, А. С. и др. (2010). Роль порядка кодонов в динамике трансляции. Cell 141, 355–367. DOI: 10.1016 / j.cell.2010.02.036

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Кастелло, А., Хорос, Р., Штрейн, К., Fischer, B., Eichelbaum, K., Steinmetz, L.M., et al. (2013). Общесистемная идентификация РНК-связывающих белков путем захвата интерактома. Нат. Protoc. 8, 491–500. DOI: 10.1038 / nprot.2013.020

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Чапат, К., Джафарнеджад, С. М., Матта-Камачо, Э., Хескет, Г. Г., Гелбарт, И. А., Аттиг, Дж. И др. (2017). Cap-связывающий белок 4EHP влияет на подавление трансляции микроРНК. Proc. Natl. Акад. Sci. НАС.А. 114, 5425–5430. DOI: 10.1073 / pnas.1701488114

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Чаппелл, С. А., Лекен, Дж. П., Паулин, Ф. Э., Дескулмейстер, М. Л., Стоунли, М., Саутар, Р. Л. и др. (2000). Мутация в c-myc-IRES приводит к усилению входа во внутренние рибосомы при множественной миеломе: новый механизм дерегуляции онкогена. Онкоген 19, 4437–4440. DOI: 10.1038 / sj.onc.1203791

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Чинголани, П., Platts, A., Wang le, L., Coon, M., Nguyen, T., Wang, L., et al. (2012). Программа для аннотирования и прогнозирования эффектов однонуклеотидных полиморфизмов, SnpEff: SNP в геноме штамма Drosophila melanogaster w1118; изо-2; iso-3. Fly 6, 80–92. DOI: 10.4161 / fly.19695

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Детассис С., Грассо М., Дель Весково В. и Денти М. А. (2017). МикроРНК делают вызов персонализированной медицине рака. Фронт. Клетка. Dev. Биол. 5:86. DOI: 10.3389 / fcell.2017.00086

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Дьяченко Л., Слэйд Г. Д., Накли А. Г., Бхаланг К., Сигурдссон А., Белфер И. и др. (2005). Генетическая основа индивидуальных вариаций восприятия боли и развития хронического болевого состояния. Гум. Мол. Genet. 14, 135–143. DOI: 10.1093 / hmg / ddi013

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Дрешер, С., Schaeffeler, E., Hitzl, M., Hofmann, U., Schwab, M., Brinkmann, U., et al. (2002). Полиморфизм гена MDR1 и расположение субстрата Р-гликопротеина фексофенадина. Br. J. Clin. Pharmacol. 53, 526–534. DOI: 10.1046 / j.1365-2125.2002.01591.x

    CrossRef Полный текст | Google Scholar

    Гардин, Дж., Йесмин, Р., Юровский, А., Цай, Ю., Скиена, С., Футчер, Б. (2014). Измерение средней скорости декодирования 61 смыслового кодона in vivo. eLife 3: e03735.DOI: 10.7554 / eLife.03735

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Гиларди Н., Вистнер А. и Шкода Р. К. (1998). Производство тромбопоэтина подавляется трансляционным механизмом. Кровь 92, 4023–4030.

    PubMed Аннотация | Google Scholar

    Гунисова С., Хронова В., Мохаммад М. П., Хиннебуш А. Г. и Валасек Л. С. (2018). Пожалуйста, не перерабатывайте! Реинициация трансляции у микробов и высших эукариот. FEMS Microbiol. Ред. 42, 165–192. DOI: 10.1093 / femsre / fux059

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Холл, Дж. М., Ли, М. К., Ньюман, Б., Морроу, Дж. Э., Андерсон, Л. А., Хьюи, Б. и др. (1990). Связь семейного рака груди с ранним началом с хромосомой 17q21. Science 250, 1684–1689. DOI: 10.1126 / science.2270482

    CrossRef Полный текст | Google Scholar

    Хиннебуш, А.Г., Иванов, И.П., Зоненберг, Н.(2016). Контроль трансляции с помощью 5′-нетранслируемых участков мРНК эукариот. Наука 352, 1413–1416. DOI: 10.1126 / science.aad9868

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Hoffmeyer, S., Burk, O., Von Richter, O., Arnold, H.P., Brockmoller, J., Johne, A., et al. (2000). Функциональные полиморфизмы гена множественной лекарственной устойчивости человека: множественные вариации последовательности и корреляция одного аллеля с экспрессией и активностью P-гликопротеина in vivo. Proc. Natl. Акад. Sci. США 97, 3473–3478. DOI: 10.1073 / pnas.97.7.3473

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Хусманн, Дж. А., Патчетт, С., Джонсон, А., Сойер, С., и Пресс, У. Х. (2015). Понимание предубеждений в экспериментах по профилированию рибосом выявляет признаки динамики трансляции у дрожжей. PLoS Genet. 11: e1005732. DOI: 10.1371 / journal.pgen.1005732

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Джексон, Р.Дж., Хеллен К. У., Пестова Т. В. (2012). Конечные и посттерминационные события в эукариотическом переводе. Adv. Protein Chem. Struct. Биол. 86, 45–93. DOI: 10.1016 / B978-0-12-386497-0.00002-5

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Камински А. и Джексон Р. Дж. (1998). Требование белка связывания полипиримидинового тракта (PTB) для внутренней инициации трансляции РНК кардиовирусов является скорее условным, чем абсолютным. РНК 4, 626–638.DOI: 10.1017 / S1355838298971898

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Kasowski, M., Grubert, F., Heffelfinger, C., Hariharan, M., Asabere, A., Waszak, S.M, et al. (2010). Вариации связывания факторов транскрипции у людей. Наука 328, 232–235. DOI: 10.1126 / science.1183621

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Кимчи-Сарфати, К., О, Дж. М., Ким, И. В., Сауна, З. Э., Кальканьо, А. М., Амбудкар, С.V., et al. (2007). «Тихий» полиморфизм в гене MDR1 изменяет субстратную специфичность. Наука 315, 525–528. DOI: 10.1126 / science.1135308

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Кирхнер, С., Цай, З., Раушер, Р., Кастелич, Н., Андин, М., Чех, А., и др. (2017). Изменение функции белка из-за молчащего полиморфизма, связанного с изобилием тРНК. PLoS Biol. 15: e2000779. DOI: 10.1371 / journal.pbio.2000779

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Козак, М.(1986). Точечные мутации определяют последовательность, фланкирующую кодон инициатора AUG, который модулирует трансляцию эукариотическими рибосомами. Cell 44, 283–292. DOI: 10.1016 / 0092-8674 (86) -2

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Козак М. (1987a). Анализ 5′-некодирующих последовательностей из 699 матричных РНК позвоночных. Nucleic Acids Res. 15, 8125–8148.

    Google Scholar

    Козак, М. (1987b). Влияние интерцистронной длины на эффективность повторной инициации эукариотическими рибосомами. Мол. Клетка. Биол. 7, 3438–3445.

    PubMed Аннотация | Google Scholar

    Козак, М. (1991). Структурные особенности мРНК эукариот, которые модулируют инициацию трансляции. J. Biol. Chem. 266, 19867–19870.

    PubMed Аннотация | Google Scholar

    Кумар А., Раджендран В., Сетумадхаван Р., Шукла П., Тивари С. и Пурохит Р. (2014). Вычислительный SNP-анализ: современные подходы и перспективы на будущее. Cell Biochem.Биофиз. 68, 233–239. DOI: 10.1007 / s12013-013-9705-6

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Кумар П., Хеникофф С. и Нг П. К. (2009). Прогнозирование влияния кодирования несинонимичных вариантов на функцию белка с использованием алгоритма SIFT. Нат. Protoc. 4, 1073–1081. DOI: 10.1038 / nprot.2009.86

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ландер, Э.С., Линтон, Л.М., Биррен, Б., Нусбаум, К., Зоди, М.C., Baldwin, J., et al. (2001). Начальная последовательность и анализ человеческого генома. Природа 409, 860–921. DOI: 10.1038 / 35057062

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ларо, Л. Ф., Хайт, Д. Х., Хоган, Г. Дж., И Браун, П. О. (2014). Четкие стадии цикла элонгации трансляции, выявленные при секвенировании защищенных рибосомами фрагментов мРНК. eLife 3: e01257. DOI: 10.7554 / eLife.01257

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ли, А.Р., Пак, Дж., Юнг, К. Дж., Джи, С. Х., и Ким-Юн, С. (2016). Генетическая вариация rs7930 в сайте-мишени miR-4273-5p связана с риском колоректального рака. Onco Targets Ther. 9, 6885–6895. DOI: 10.2147 / OTT.S108787

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ли, Л., и Вэй, Д. (2015). Инструменты биоинформатики для обнаружения и функционального анализа однонуклеотидных полиморфизмов. Adv. Exp. Med. Биол. 827, 287–310. DOI: 10.1007 / 978-94-017-9245-5_17

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ли, К., Макри, А., Лу, Ю., Маршан, Л., Грабс, Р., Руссо, М. и др. (2013). Полногеномный поиск экзонных вариантов, влияющих на эффективность трансляции. Нат. Commun. 4: 2260. DOI: 10.1038 / ncomms3260

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Лю Л., Дилворт Д., Гао Л., Монзон Дж., Саммерс А., Лассам Н. и др. (1999). Мутация 5 ‘UTR CDKN2A создает аберрантный инициирующий кодон и предрасполагает к меланоме. Нат. Genet. 21, 128–132. DOI: 10.1038 / 5082

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Маркотриджиано, Дж., Ломакин, И. Б., Соненберг, Н., Пестова, Т. В., Хеллен, К. У. и Берли, С. К. (2001). Консервативный домен HEAT в eIF4G управляет сборкой механизма инициации трансляции. Мол. Cell 7, 193–203. DOI: 10.1016 / S1097-2765 (01) 00167-8

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Маккарролл, С.А., Хэднотт, Т. Н., Перри, Г. Х., Сабети, П. К., Зоди, М. К., Барретт, Дж. К. и др. (2006). Распространенные делеционные полиморфизмы в геноме человека. Нат. Genet. 38, 86–92. DOI: 10.1038 / ng1696

    CrossRef Полный текст | Google Scholar

    Менделл, Дж. Т., и Дитц, Х. С. (2001). Когда сообщение идет наперекосяк: вызывающие заболевание мутации, влияющие на содержание и производительность мРНК. Cell 107, 411–414. DOI: 10.1016 / S0092-8674 (01) 00583-9

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    мин, стр., Li, W., Zeng, D., Ma, Y., Xu, D., Zheng, W., et al. (2017). Вариант с одним нуклеотидом в микроРНК-1269a способствует возникновению и развитию гепатоцеллюлярной карциномы путем нацеливания на онкогены SPATS2L и LRP6. Бык. Рак 104, 311–320. DOI: 10.1016 / j.bulcan.2016.11.021

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Морита М., Лер Л. В., Фабиан М. Р., Сиддики Н., Муллин М., Хендерсон В. К. и др. (2012). Новый репрессорный комплекс трансляции 4EHP-GIGYF2 необходим для развития млекопитающих. Мол. Клетка. Биол. 32, 3585–3593. DOI: 10.1128 / MCB.00455-12

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Мошинска А., Геберт М., Коллон Дж. Ф. и Бартошевски Р. (2017). SNP в сайтах-мишенях микроРНК и их потенциальная роль в заболеваниях человека. Open Biol. 7: 170019. DOI: 10.1098 / rsob.170019

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Мерфи С., Петерсон П., Иланд Х. и Ласло Дж. (1997).Опыт группы по изучению истинной полицитемии в отношении эссенциальной тромбоцитемии: окончательный отчет о диагностических критериях, выживаемости и лейкозном переходе при лечении. Семин. Гематол. 34, 29–39.

    PubMed Аннотация | Google Scholar

    Накли А.Г., Шабалина С.А., Чивилева И.Э., Саттерфилд К., Корчинский О., Макаров С.С. и др. (2006). Гаплотипы катехол-О-метилтрансферазы человека модулируют экспрессию белка, изменяя вторичную структуру мРНК. Наука 314, 1930–1933. DOI: 10.1126 / science.1131262

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Николсон П., Епископосян Х., Метце С., Замудио Ороско Р., Кляйншмидт Н. и Мюлеманн О. (2010). Нонсенс-опосредованный распад мРНК в клетках человека: понимание механизмов, функции вне контроля качества и двойная жизнь факторов NMD. Ячейка. Мол. Life Sci. 67, 677–700. DOI: 10.1007 / s00018-009-0177-1

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Нислер, Б., Flohr, T., Nothen, M. M., Fischer, C., Rietschel, M., Franzek, E., et al. (2001). Связь между 5 ‘UTR-вариантом C178T гена серотонинового рецептора HTR3A и биполярным аффективным расстройством. Фармакогенетика 11, 471–475. DOI: 10.1097 / 00008571-200108000-00002

    CrossRef Полный текст | Google Scholar

    Онер Р., Агарвал С., Димовски А. Дж., Ефремов Г. Д., Петков Г. Х., Алтай К. и др. (1991). Мутация G-A в положении + 22 3 ‘к сайту Cap бета-глобинового гена как возможная причина бета-талассемии. Гемоглобин 15, 67–76. DOI: 10.3109 / 036302691085

    CrossRef Полный текст | Google Scholar

    Орлоу И., Бегг К. Б., Котинола Дж., Рой П., Хаммер А. Дж., Клас Б. А. и др. (2007). Мутации зародышевой линии CDKN2A у лиц со злокачественной меланомой кожи. J. Invest. Дерматол. 127, 1234–1243. DOI: 10.1038 / sj.jid.5700689

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Орр, Н., Чанок, С. (2008). Общие генетические вариации и болезни человека. Adv. Genet. 62, 1–32. DOI: 10.1016 / S0065-2660 (08) 00601-9

    CrossRef Полный текст | Google Scholar

    Полин Ф. Э., Чаппелл С. А. и Уиллис А. Э. (1998). Одно нуклеотидное изменение во внутреннем сегменте входа в рибосому c-myc приводит к усиленному связыванию группы белковых факторов. Nucleic Acids Res. 26, 3097–3103. DOI: 10.1093 / nar / 26.13.3097

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Пеллетье, Дж., Графф, Дж., Руджеро Д., Зоненберг Н. (2015). Ориентация на комплекс инициации трансляции eIF4F: критическая связь для развития рака. Cancer Res. 75, 250–263. DOI: 10.1158 / 0008-5472.CAN-14-2789

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Пеллетье Дж. И Зоненберг Н. (1985). Инсерционный мутагенез для увеличения вторичной структуры в 5′-некодирующей области эукариотической мРНК снижает эффективность трансляции. Cell 40, 515–526.DOI: 10.1016 / 0092-8674 (85)

  • -4

    CrossRef Полный текст | Google Scholar

    Пикеринг Б. М., Уиллис А. Э. (2005). Влияние структурированных 5′-нетранслируемых областей на трансляцию и болезнь. Семин. Клетка. Dev. Биол. 16, 39–47. DOI: 10.1016 / j.semcdb.2004.11.006

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Пула, Ф., Десклозо, М., Таффери, С., Джей, П., Бойзе, Б., и Берта, П. (1998). Мутация в 5′-некодирующей области гена SRY у пациента с измененным полом XY. Гум. Мутат. Дополнение 1, S192 – S194. DOI: 10.1002 / humu.1380110162

    CrossRef Полный текст | Google Scholar

    Пойри, Т. А., Камински, А., Джексон, Р. Дж. (2004). Что определяет, возобновят ли сканирование рибосомы млекопитающих после трансляции короткой вышележащей открытой рамки считывания? Genes Dev. 18, 62–75.

    PubMed Аннотация | Google Scholar

    Сандберг Р., Нейлсон Дж. Р., Сарма А., Шарп П. А. и Бердж К. Б. (2008). Пролиферирующие клетки экспрессируют мРНК с укороченными 3′-нетранслируемыми областями и меньшим количеством сайтов-мишеней для микроРНК. Наука 320, 1643–1647. DOI: 10.1126 / science.1155390

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Schulz, J., Mah, N., Neuenschwander, M., Kischka, T., Ratei, R., Schlag, P.M, et al. (2018). Мутации с потерей функции uORF при злокачественных новообразованиях человека. Sci. Отчет 8: 2395. DOI: 10.1038 / s41598-018-19201-8

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Шен, Л. X., Базилион, Дж. П., и Стэнтон, В. П. младший.(1999). Однонуклеотидные полиморфизмы могут вызывать различные структурные складки мРНК. Proc. Natl. Акад. Sci. США 96, 7871–7876. DOI: 10.1073 / pnas.96.14.7871

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Синьори, Э., Баньи, К., Папа, С., Примерано, Б., Ринальди, М., Амальди, Ф. и др. (2001). Соматическая мутация в 5’UTR гена BRCA1 при спорадическом раке молочной железы вызывает снижение эффективности трансляции. Онкоген 20, 4596–4600.DOI: 10.1038 / sj.onc.1204620

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Somers, J., Wilson, L.A., Kilday, J.P., Horvilleur, E., Cannell, I.G., Poyry, T.A., et al. (2015). Общий полиморфизм в 5′-UTR ERCC5 создает расположенную выше ORF, которая придает устойчивость к химиотерапии на основе платины. Genes Dev. 29, 1891–1896. DOI: 10.1101 / gad.261867.115

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Зоненберг, Н.и Хиннебуш А.Г. (2009). Регуляция инициации трансляции у эукариот: механизмы и биологические мишени. Cell 136, 731–745. DOI: 10.1016 / j.cell.2009.01.042

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Сринивасан, С., Клементс, Дж. А., и Батра, Дж. (2016). Однонуклеотидные полиморфизмы в клиниках: фантастика или реальность для рака? Крит. Преподобный Clin. Лаборатория. Sci. 53, 29–39. DOI: 10.3109 / 10408363.2015.1075469

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Стоунли, М., Paulin, F.E., Le Quesne, J.P., Chappell, S.A., and Willis, A.E. (1998). Нетранслируемая область C-Myc 5 ‘содержит внутренний входной сегмент рибосомы. Онкоген 16, 423–428. DOI: 10.1038 / sj.onc.1201763

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Сабо, К. И., и Кинг, М. К. (1995). Унаследованный рак груди и яичников. Гум. Мол. Genet. 4, 1811–1817. DOI: 10.1093 / hmg / 4.suppl_1.1811

    CrossRef Полный текст | Google Scholar

    Тензер, С., Моро, А., Кухарев, Дж., Фрэнсис, А. С., Видалино, Л., Провензани, А. и др. (2013). Полнопротеомная характеристика РНК-связывающего белка RALY-интерактома с использованием подхода in vivo-biotinylation-pulldown-Quant (iBioPQ). J. Proteome Res. 12, 2869–2884. DOI: 10.1021 / pr400193j

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Томас, Л. Ф., и Саэтром, П. (2012). Полиморфизм одиночных нуклеотидов может создавать альтернативные сигналы полиаденилирования и влиять на экспрессию генов за счет потери регуляции микроРНК. PLoS Comput. Биол. 8: e1002621. DOI: 10.1371 / journal.pcbi.1002621

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Wang, T., Chen, Y.H., Hong, H., Zeng, Y., Zhang, J., Lu, J.P., et al. (2009). Повышенные нуклеотидные полиморфные изменения в 5′-нетранслируемой области гена дельта-катенина (CTNND2) при раке простаты. Онкоген 28, 555–564. DOI: 10.1038 / onc.2008.399

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Вайнберг, Д.Э., Шах, П., Эйххорн, С. В., Хусманн, Дж. А., Плоткин, Дж. Б., и Бартель, Д. П. (2016). Улучшенные измерения рибосомного следа и мРНК дают представление о динамике и регуляции дрожжевой трансляции. Cell Rep. 14, 1787–1799. DOI: 10.1016 / j.celrep.2016.01.043

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Вистнер А., Шлемпер Р. Дж., Ван Дер Маас А. П. и Шкода Р. К. (1998). Активирующая мутация донора сплайсинга в гене тромбопоэтина вызывает наследственную тромбоцитемию. Нат. Genet. 18, 49–52. DOI: 10.1038 / ng0198-49

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Witt, H., Luck, W., Hennies, H.C., Classen, M., Kage, A., Lass, U., et al. (2000). Мутации в гене, кодирующем ингибитор сериновой протеазы, Kazal типа 1, связаны с хроническим панкреатитом. Нат. Genet. 25, 213–216. DOI: 10.1038 / 76088

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Сюй, Х., Ван, П., You, J., Zheng, Y., Fu, Y., Tang, Q., et al. (2010). Скрининг SNP, расположенных по мотивам Козака, и анализ их ассоциации с заболеваниями человека. Biochem. Биофиз. Res. Commun. 392, 89–94. DOI: 10.1016 / j.bbrc.2010.01.002

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ямасита А., Такеучи О. (2017). Трансляционный контроль мРНК с помощью связывающих белков 3′-нетранслируемой области. BMB Rep. 50, 194–200. DOI: 10.5483 / BMBRep.2017.50.4.040

    CrossRef Полный текст | Google Scholar

    Янагия А., Свиткин Ю. В., Шибата С., Миками С., Иматака Х. и Соненберг Н. (2009). Необходимость связывания РНК фактора инициации трансляции эукариот млекопитающих 4GI (eIF4GI) для эффективного взаимодействия eIF4E с кэпом мРНК. Мол. Клетка. Биол. 29, 1661–1669. DOI: 10.1128 / MCB.01187-08

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    MGI-Рекомендации по номенклатуре генов, генетических маркеров, аллелей и мутаций у мышей и крыс

    Рекомендации по номенклатуре генов, генетических маркеров, аллелей и мутаций у мышей и крыс

    Доработана: сентябрь 2021 г.

    Международный комитет по стандартизированной генетической номенклатуре мышей

    Председатель: Dr.Синтия Смит
    (электронная почта: [email protected])

    Комитет по геному и номенклатуре крыс

    Председатель: Д-р Стэнли Лауледеркинд

    Правила генетической номенклатуры мышей были впервые опубликованы Данном, Грюнебергом и Снеллом (1940), а последующие версии были опубликованы Международным комитетом по стандартизированной генетической номенклатуре мышей (1963, 1973, 1981, 1989, 1996). Самую последнюю публикацию рекомендаций по номенклатуре мышей можно найти у Eppig (2006).Однако следует сообщить пользователям, что эта веб-версия представляет собой текущую политику номенклатуры Международного комитета по стандартизированной генетической номенклатуре мышей и имеет прецедент по сравнению с ранее опубликованными версиями.

    Правила генетической номенклатуры крыс были впервые опубликованы Комитетом по номенклатуре крыс в 1992 году, а затем Levan et al. в 1995 году.

    В 2003 году Международный комитет по стандартизированной генетической номенклатуре мышей и
    Комитет по геному и номенклатуре крыс согласился унифицировать правила и рекомендации
    для номенклатуры генов, аллелей и мутаций у мышей и крыс.Руководства по номенклатуре в настоящее время ежегодно пересматриваются и обновляются двумя международными комитетами; текущие руководящие принципы могут быть
    можно найти на сайтах MGD и RGD.

    Чтобы просмотреть предыдущие версии этого руководства (последний раз редактировалось в декабре 2015 г.), щелкните здесь.

    Содержание

    1 Принципы номенклатуры
    1.1 Основные характеристики
    1.2 Определения
    1.3 Стабильность номенклатуры
    1.4 Синонимы
    1.5 Символы генов, белки и обозначения хромосом в публикациях
    1.5.1 Символы генов и аллелей
    1.5.2 Символы белков
    1.5.3 Обозначения хромосом

    2 Символы и названия генов и локусов
    2.1 Лабораторные коды
    2.2 Идентификация новых генов
    2.3 Символы и названия генов
    2.3.1 Символы генов
    2.3.2 Названия генов
    2.4 Структурные гены, варианты сплайсинга и промоторы
    2.4.1 Альтернативные транскрипты
    2.4.2 Сквозные транскрипты
    2.4.3 Антисмысловые и противоположные гены
    2.4.4 Гены с гомологами у других видов
    2.5 Названия и символы фенотипов
    2.5.1 Летальные фенотипы
    2.6 Семейства генов
    2.6.1 Семьи, идентифицированные гибридизацией
    2.6.2 Семьи, идентифицированные путем сравнения последовательностей
    2.7 EST
    2.8 Анонимные сегменты ДНК
    2.8 .1 Картированные сегменты ДНК
    2.8.2 STS, используемые при физическом картировании
    2.9 Локусы генной ловушки
    2.10 Локусы количественных признаков, гены устойчивости и гены иммунного ответа
    2.10.1 Названия и символы QTL
    2.10.2 Определение уникальности в QTL
    2.11 Хромосомные области
    2.11.1 Теломеры
    2.11.2 Центромеры и перицентрический гетерохроматин
    2.11.3 Организаторы ядрышка
    2.11.4 Гомогенно окрашивающие области
    2.12 Гены, расположенные на митохондриях
    2.13 Гены домашнего хозяйства РНК, закодированные в ядре
    2.14 микроРНК и кластеры микроРНК
    2.15 Длинные некодирующие РНК
    2.16 Энхансеры, промоторы и регуляторные области

    3 Названия и символы для вариантов и мутантных аллелей
    3.1 Мутантные фенотипы
    3.1.1 Гены, известные только мутантным фенотипам
    3.1.2 Фенотипы, вызванные мутациями в структурных генах
    3.1.3 Дикий тип Аллели и ревертанты
    3.2 Варианты
    3.2.1 Биохимические варианты
    3.2.2 Варианты сегментов ДНК
    3.2.3 Однонуклеотидные полиморфизмы (SNP)
    3.2.4 Геномный вариант
    3.3 Вариация локусов количественных признаков и генов ответа и устойчивости
    3.4 Инсерционные и индуцированные мутации
    3.4.1 Мутации структурных генов
    3.4.2 Трансгенные инсерционные мутации
    3.5 Целевые и захваченные мутации
    3.5.1 Нокаут, нокаут, условные и другие Целевые мутации
    3.5.2 Мутации, опосредованные эндонуклеазами
    3.5.3 Мутации генных ловушек
    3.5.4 Энхансерные ловушки

    4 Трансгены
    4.1 Символы трансгенов
    4.2 Сайты межгенных вставок, используемые в качестве сайтов посадки «нейтральных» реципиентных последовательностей

    5 Мутации и вставки, индуцированные транспозонами
    5.1 Конкатамеры трансгенных мобильных элементов (TE)
    5.2 Транспозазные вставки
    5.3 Транспонированные вставные аллели

    6 Определения
    6.1 Ген
    6.2 Pseudogen
    6.3 Локус
    6.4 Маркер
    6.5 Аллель
    6.6 Аллельный вариант
    6.7 Вариант сплайсинга или альтернативный сплайс
    6.8 Мутация
    6.9 Доминантный и рецессивный
    6.10 Генотип
    6.11 Фенотип
    6.12 Локусы количественных признаков (QTL)
    6,13 Гаплотип
    6,14 Гомолог
    6,15 Ортолог
    6,16 Паралог
    6,17 Кластер

    7 Ссылки


    1 Принципы номенклатуры

    1.1 Основные характеристики

    Ключевым компонентом номенклатуры является имя и символ гена или локуса, которые идентифицируют единицу наследования. Другие особенности, такие как аллели, варианты и мутации, вторичны по отношению к названию гена и становятся
    связанные с ним.Точно так же зонды или анализы, используемые для обнаружения гена, не являются первичными характеристиками и обычно не должны использоваться в качестве названий.

    Основная цель имени и символа гена или локуса — быть уникальным идентификатором, чтобы информация о гене в публикациях, базах данных и других формах
    коммуникация может быть однозначно связана с правильным геном. Это руководство, таким образом, предназначено для того, чтобы помочь научному сообществу в целом использовать генетическую информацию.

    Прочие второстепенные функции номенклатуры генов:

    • идентифицирует ген как член семьи, что может дать дополнительную информацию о гене
      со ссылкой на других членов семьи
    • идентифицировать ген как ортолог гена у другого млекопитающего (обычно человека)

    1.2 Определения

    Важно, чтобы пользователь понимал, что называется, и принципы, лежащие в основе этих рекомендаций.
    В разделе 6 представлены определения, которые помогут пользователю различать, например, гены, локусы, маркеры и аллели.

    1.3 Стабильность номенклатуры

    В целом названия генов должны быть стабильными; то есть их не следует менять с течением времени. Однако есть определенные обстоятельства, при которых изменение желательно:

    • В случаях, когда ген был известен только как мутантный фенотип и назван в его честь: когда мутировавший ген идентифицирован, имя мутанта становится именем мутантного аллеля идентифицированного гена (см.1.2).
    • Когда ген назначается семейству генов (паралогов) и устанавливается номенклатура этого семейства. (см. раздел 2.6.2).
    • Если ортологичный ген (ы) был идентифицирован между
      мышь, крыса и человек, и для всех трех видов принят общий символ.

    1.4 Синонимы

    У гена может быть несколько синонимов, то есть имен или символов, которые применялись к гену в разное время. Эти синонимы могут быть связаны с геном в базах данных и публикациях, но установленные
    имя и символ гена всегда следует использовать в качестве первичного идентификатора.

    1.5 Символы генов, белки и обозначения хромосом в публикациях

    1.5.1 Символы генов и аллелей

    Символы генов при публикации выделяются курсивом, как и символы аллелей. Раздел 2 ниже определяет правила именования для определения правильных символов генов. Трансгены, не являющиеся частью нативного генома, курсивом не выделяются. Для определения правильного назначения символов гена и аллеля доступна помощь ([email protected]), а символы можно зарезервировать перед публикацией в частном порядке.

    Чтобы различать формы мРНК, геномной ДНК и кДНК в рукописи, напишите соответствующий префикс в скобках перед символом гена, например (мРНК) Rbp1 .

    1.5.2 Белковые символы

    Обозначения белков соответствуют тем же правилам, что и символы генов, со следующими двумя различиями:

    • В символах белков используются только прописные буквы.
    • Символы белков не выделены курсивом.
    1.5.3 Обозначения хромосом
    • Используйте заглавную букву «C» при обозначении конкретной хромосомы мыши (например,g., хромосома 15) для аутосомных хромосом. Для половых хромосом допускается использование «Х-хромосомы» или «Y-хромосомы».
    • При сокращении слова Хромосома не используйте точку («.») После сокращения (например, Хромосома 15 должна сокращаться как Chr 15, а не Chr.15).

    2 символа и названия генов и локусов

    Основная функция имени гена — предоставить уникальный идентификатор.

    База данных генома мышей (MGD) служит центральным хранилищем названий генов и символов, чтобы избежать использования одного и того же имени для разных генов или использования нескольких
    названия одного и того же гена (http: // www.informatics.jax.org). Номенклатурный комитет MGD ([email protected]) предоставляет консультации и помощь в присвоении новых имен и символов. Веб-инструмент для предложения нового символа локуса мыши находится на сайте MGD.

    Для крыс эти функции выполняет RGD (http://rgd.mcw.edu) при содействии Международного комитета по геному и номенклатуре крыс (RGNC). Веб-инструмент для предложения нового символа локуса крысы находится на сайте RGD.

    2.1 Лабораторные коды

    Ключевой особенностью номенклатуры мышей и крыс является регистрационный код лаборатории или код лаборатории, который обычно состоит из трех-четырех букв (первая буква в верхнем регистре, а затем все в нижнем регистре), который идентифицирует
    конкретный институт, лаборатория или исследователь, которые производили и могут хранить запасы
    Например, маркер ДНК, линия мыши или крысы или создатель новой мутации.Лабораторные коды также используются для обозначения хромосомных аберраций, трансгенов и генно-инженерных мутаций. Поскольку коды лабораторий являются ключом к идентификации исходных источников, они присваиваются не «проектам», а скорее конкретному производителю / создателю или сайту.
    Коды лабораторий могут быть присвоены через MGD или непосредственно Институтом исследований лабораторных животных (ILAR) по адресу http://dels-old.nas.edu/ilar_n/ilarhome/register_lc.php.

    Примеры:

    J The Jackson Laboratory
    Mit Massachusetts
    Технологический институт
    Leh Hans Lehrach
    Kyo Kyoto University
    Ztm Central Animal Laboratory Medical School Hannover

    2.2 Идентификация новых генов

    Идентификация новых генов в целом происходит двумя способами; идентификация нового белка или последовательности ДНК или идентификация нового фенотипа или признака.
    В случае последовательностей следует проявлять осторожность при интерпретации результатов поиска в базе данных для установления новизны (например, чтобы различать новый член семейства генов и аллель или альтернативный транскрипт существующего члена семьи).
    Новые мутантные фенотипы или признаки должны быть названы в соответствии с их первичной характеристикой, но как только ген, ответственный за фенотипические вариации, идентифицирован, это дает первичное название гена, а название мутанта становится названием аллеля (см. Раздел 2.3).

    2.3 Символы и названия генов

    2.3.1 Генные символы

    Гены обозначены короткими символами в качестве удобных сокращений для того, чтобы говорить и писать о генах.

    A символ гена должен:

    • быть уникальным в пределах данного вида и не должно совпадать с символом у другого вида, который
      не является гомологом.
    • быть коротким, обычно 3-5 знаков, но не более 10 знаков
    • использовать
      только латинские буквы и арабские цифры
    • начинается с заглавной буквы (не числа), за которой следуют все строчные буквы / цифры (см. Исключение ниже)
    • без обозначения тканевой специфичности или молекулярной массы
    • включать знаки препинания только в особых случаях (см. Ниже)
    • В идеале

    • иметь ту же начальную букву, что и начальная буква названия гена, чтобы облегчить индексацию.Однако порядок букв в символе гена не обязательно должен соответствовать порядку слов в имени.
    • Когда существует окончательный человеческий ортолог, символы генов должны согласовываться с символами человеческих генов, когда это возможно.
      • Никогда не добавляйте «m» (для символа гена мыши) или «r» (для символа гена крысы), чтобы указать вид.

    Примеры:

    Plaur Активатор плазминогена, рецептор урокиназы
    Sta аутосомное чередование
    • в опубликованных статьях выделяться курсивом.Поскольку их трудно читать, в зависимости от браузера, символы генов часто не выделяются курсивом при размещении на веб-странице
    • использует общий символ основы или корня, когда принадлежит к семейству генов. Номера членов семьи или обозначения субъединиц следует помещать в конце символа гена.

    Примеры:

    рецептор глицина

    • по возможности используйте один и тот же символ для ортологов человека, мыши и крысы.
    • Если модель гена мыши доступна в NCBI или ENSEMBL, используется символ Gm (модель гена).

    Исключения из правила первой буквы верхнего регистра и оставшихся строчных букв в гене
    или символ локуса:

    • Если ген (локус) идентифицируется только по рецессивному мутантному фенотипу, то символ должен начинаться со строчной буквы. Как только продукт мутантного гена идентифицирован, продукт гена
      получив имя и символ, и исходный символ и имя, основанные на фенотипе, становятся символом и именем аллеля.Рецессивная природа аллеля по-прежнему передается начальной строчной буквой.
    • Внутри символа гена коды лабораторий начинаются с заглавной буквы
    • .

    • При описании кросс-гибридизующихся сегментов ДНК код H (человека) или другого вида пишется прописными буквами, например D2h21S14.
    • Если информация недоступна, кроме самой последовательности, используйте идентификатор последовательности из коллекции генов млекопитающих, RIKEN или GenBank (, например, , AF067061, 0610009F21Rik).Если для нового гена доступно несколько источников последовательностей, предпочтение отдается сначала идентификатору клона RIKEN, а затем идентификатору клона BC (из коллекции генов млекопитающих).

    Использование дефисов внутри символа должно быть сведено к минимуму. Ситуации, в которых могут использоваться дефисы, включают:

    • для отделения связанных символов последовательности и псевдогенных символов от корня
    • локусов гена гистосовместимости

    Примеры:

    Glra1 рецептор глицина альфа 1
    Glra2 рецептор глицина альфа 2
    Glra3
    Fpr-rs6 рецептор формилпептида, родственная последовательность 6
    h3-Ab1 гистосовместимость 2, антиген A класса II, бета 1

    Пример:

    Набор W-v Набор онкоген
    Название аллеля: жизнеспособное доминантное пятнистость
    • внутри символов трансгена для разделения промотора и экспрессируемых последовательностей (Раздел 4)

    Пример:

    Tg (Drd2-EGFP) S118Gsat Вставка трансгена S118, проект GENSAT в Университете Рокфеллера

    2.3.2 Имена генов

    Названия генов должны быть краткими и содержать точную информацию о гене. Когда существует окончательный человеческий ортолог, названия генов должны также согласовываться с названиями человеческих генов, когда это возможно. Название не должно содержать подробной информации об используемом гене или анализе; это
    могут быть связаны с геном в публикациях или базах данных. Хотя в идеале название гена должно быть информативным относительно функции или природы гена,
    Следует проявлять осторожность, чтобы не указывать в названии неточную информацию.Например, последующие исследования могут показать, что «белок, специфичный для печени», экспрессируется где-то еще.

    Имя гена должно:

    • быть конкретным и кратким, передавая характер или функцию гена
    • начинаются со строчной буквы, если это не имя человека или слово, которое обычно пишется с заглавной буквы.

    • Примеры:

      Wt1 Гомолог опухоли Вильмса 1
      Acly АТФ цитратлиаза
    • использовать американское написание
    • не содержать знаков препинания, за исключением случаев, когда необходимо отделить основную часть имени от модификаторов, или если запятая является частью имени белка.

    • Примеры:

      A4galt альфа 1,4-галактозилтрансфераза
      Zfy1 цинковый палец-белок 1, Y-связанный
    • включают название вида, от которого произошло название ортолога / гомолога, в конце названия в круглых скобках только , если это название не является общеупотребительным.

    • Примеры:

      Shh sonic hedgehog
      [обычно используется, не включает название вида]
      Ssu2 гомолог ssu-2 (C.elegans)
      [в название включены производные вида]
    • НЕ включает слово «мышь» (для названия гена мыши) или слово «крыса» (для названия гена крысы).
    • следует соглашениям установленного семейства генов, если он является узнаваемым членом этого семейства по сравнению последовательностей, структуре (мотивы / домены) и / или функции
    • не содержит потенциально вводящей в заблуждение информации, которая может иметь отношение к эксперименту или анализу, например, «специфично для почек» или «59 кДа».

    2.4 структурных гена, варианты сплайсинга и промоторы

    В конечном итоге, большинство названий генов будут относиться к структурным генам, кодирующим белок. Во всех случаях, когда белок идентифицируется, гену следует по возможности давать то же имя, что и белок. Если ген распознается путем сравнения последовательностей
    как член установленного семейства генов, он должен называться соответствующим образом (см. Раздел 2.6).

    2.4.1 Альтернативные стенограммы

    Альтернативным транскриптам, происходящим из одного и того же гена, обычно не присваиваются разные символы и названия генов.Для обозначения конкретных форм сплайсинга гена следует использовать следующий формат (символ гена, за которым следует подчеркивание, за которым следует идентификатор доступа к последовательности): Genesymbol_accID

    Пример:

    транскрипт

    Хотя есть возможность включить важную информацию о векторах, промоторах и т. Д.в скобках символа трансгена это должно быть минимизировано для краткости и ясности. Функция символа — обеспечить уникальное обозначение гена, локуса или мутации. Мелкие молекулярные детали этих локусов и мутаций должны находиться в таких базах данных, как MGD и RGD.

    4.2 Межгенные сайты, используемые в качестве «нейтральных» сайтов посадки реципиентной последовательности

    Обычно используемые сайты вставки включают Gt (Rosa) 26Sor и Hprt . Характеристики этих локусов таковы, что они «доброкачественны», так как не влияют на экспрессию или функцию других генов.Идентифицируются новые сайты, которые являются межгенными, которые также могут служить в качестве нейтральных сайтов встраивания для трансгенеза и обозначены Igs # (Intergenic site #), где # указывает порядковый номер.

    Эти межгенные геномные последовательности могут быть модифицированы направленными, спонтанными или другими способами мутагенеза для облегчения создания аллелей для модифицированных межгенных сайтов, таких как те, которые генерируются с помощью нацеливания на MICER или нокаут-аллелей для высококонсервативных последовательностей, которые находятся в межгенных последовательностях.В общем, эти сайты являются доброкачественными, не влияющими на экспрессию или функцию других генов, но могут действовать как родовые сайты для многих видов встроенной ДНК. Эти маркеры отличаются от маркеров регуляторной области тем, что локусы Igs # не обладают регуляторной функцией.

    Межгенные участки следует обозначать следующим образом:

    Igs # Intergenic site #, где # указывает следующий номер в серии.

    5 Мутации и вставки, индуцированные транспозонами

    Три типа генетических вставок участвуют в создании мутаций, индуцированных транспозонами.Две линии, одна из которых несет транспозируемый элемент в качестве конкатамера, а другая — транспозазу, соединяются. Это заставляет мобильный элемент вступать в контакт с транспозазой и мобилизоваться из своего исходного сайта, и при реинтеграции в геном может вызвать наследственную фенотипическую мутацию. ( ср. , Динг, и др., ., 2005; Bestor, 2005; Дюпюи, и др., , 2005). Принятая номенклатура вставок с подвижными элементами, трансгенов транспозаз и результирующих аллелей транспонированных вставок приведена ниже.

    5.1 Конкатамеры трансгенных мобильных элементов (TE)

    Конкатамеры трансгенных мобильных элементов идентифицируются стандартным префиксом Tg (для трансгенных) и Tn (для мобильных элементов). Класс переносного элемента может быть указан в скобках. Общий формат символа:

    TgTn (transposon_class_abbreviation-vector) #Labcode


    Пример: TgTn (sb-T2 / GT2 / tTA) 1Dla

    Символ состоит из:

    • Tg, обозначающий трансгенный
    • Tn обозначает транспозон
    • В круглых скобках сокращенное название класса транспозонов в нижнем регистре (в данном случае sb означает «Спящая красавица»), за которым следует дефис и обозначение вектора.
    • .

    • Линия лаборатории или наименование учредителя или серийный номер
    • Лабораторный код исходной лаборатории

    5.2 вставки Transposase

    Транспозазы могут быть встроены в геном посредством трансгенеза или специфического нацеливания на гены. В этих случаях используется соответствующая номенклатура трансгенов или целевых мутаций.

    Для трансгена используйте стандартный префикс Tg (для трансгена). Содержимое круглых скобок обычно представляет собой промотор и символ транспозазы, с которой он связан, разделенные дефисом. Общий формат символа:

    Tg (промотор-транспозаза) #Labcode


    Пример: Tg (ACTB-sb10) 545Abc

    Символ состоит из:

    • Tg, обозначающего трансген
    • В скобках — официальный символ гена для промотора с использованием номенклатуры вида происхождения, за которым следуют дефис и символ транспозазы в нижнем регистре, в данном случае sb10 для транспозазы Sleeping Beauty 10
    • Линия лаборатории или наименование учредителя или серийный номер
    • Лабораторный код исходной лаборатории

    Для целенаправленного включения транспозазы используйте стандартный формат целевой мутации, i.е. , символ целевого гена с надстрочным символом аллеля, начинающимся с префикса tm . Содержимое круглых скобок обычно является символом транспозазы, с которой она связана. Общий формат символа:

    Ген tm # (транспозаза) Labcode


    Пример: Gt (ROSA) 26Sor tm1 (sb11) Njen

    Символ состоит из:

    • Ген, в который была интегрирована транспозаза, в данном случае Gt (ROSA) 26Sor
    • В верхнем индексе:
      • tm обозначает целевую мутацию
      • Серийный номер целевой мутации
      • В скобках — символ транспозазы в нижнем регистре, в данном случае sb11 для транспозазы Sleeping Beauty 11
      • Лабораторный код исходной лаборатории

    5.3 транспонированных вставленных аллеля

    Эти аллели соответствуют правилам наименования всех других аллелей. Как правило, маркер конкатамера перемещаемых элементов уже будет установлен, как указано выше. Таким образом, новый аллель будет представлять собой верхний индекс символа конкатамера. Обратите внимание, что все такие аллели, которые «происходят из» конкатамера мобильных элементов, несут исходный номер с десятичной точкой и порядковый номер, идентифицирующий конкретный аллель. Общий формат:

    Ген Tn (transposon_class_abbreviation-vector) # Labcode


    Пример: Car12 Tn (sb-T2 / GT2 / tTA) 1.1Dla

    Символ состоит из:

    • Ген, в который был интегрирован (транспонирован) мобильный элемент
    • В верхнем индексе:
      • Tn обозначает транспозон
      • В круглых скобках сокращенное наименование класса транспозонов в нижнем регистре (в данном случае sb означает «Спящая красавица»), за которым следует дефис и обозначение вектора.
      • Серийный номер, в котором первичный номер соответствует номеру, присвоенному конкатамеру мобильного элемента, из которого он возник, за которым следует десятичная точка и порядковый номер, обозначающий его номер в серии производных аллелей вставки.
      • Лабораторный код лаборатории, создавшей линию сменных элементов

    Если новая транспонированная вставка происходит в неизвестном сайте или межгенном регионе, форма:

    Tn (transposon_class_abbreviation-vector) #Labcode

    используется для обозначения «геномной мутации» без надстрочного индекса символа гена, подобно тому, как обозначается случайный трансген, вставленный в негенный сайт.

    6 Определения

    Следующие определения должны помочь пользователю понять, что называется, и понять принципы, лежащие в основе этих рекомендаций.

    6,1 Ген

    Ген — это функциональная единица, обычно кодирующая белок или РНК, наследование которой можно проследить экспериментально. Наследование обычно проверяется при генетическом скрещивании, но идентификация гена на цитогенетических или физических картах является другим способом картирования локуса гена. Существование
    ген также может быть выведен в отсутствие какой-либо генетической или физической информации о карте, например, из последовательности кДНК.

    6.2 Псевдоген

    Последовательность, которая очень похожа на известный функциональный ген в другом локусе в геноме, нефункциональная вследствие (обычно нескольких) мутаций, которые предотвращают его
    транскрипция или перевод (или оба).В общем, псевдогены являются результатом обратной транскрипции транскрипции их «нормального» паралога (в этом случае псевдоген
    обычно не имеет интронов и включает поли (А) хвост; часто называемые обработанными псевдогенами) или в результате рекомбинации (в этом случае псевдоген обычно является тандемной дупликацией своего
    «нормальный» паралог). Обратите внимание, что у мышей и крыс ген может быть псевдогеном в одном инбредном штамме, но не в другом.

    6.3 Локус

    Локус — это точка в геноме, идентифицированная маркером, которую можно картировать некоторыми способами.Это не обязательно соответствует гену; это может быть, например, анонимная некодирующая ДНК
    сегмент или цитогенетический признак. Один ген может иметь несколько локусов (каждый определяется разными маркерами), и эти маркеры могут быть разделены в экспериментах по генетическому или физическому картированию.
    В таких случаях полезно определить эти разные локусы, но обычно имя гена следует использовать для обозначения самого гена, так как оно обычно передает большую часть информации.

    6.4 Маркер

    Маркер — это средство идентификации гена или локуса.Маркер зависит от анализа, который может, например, идентифицировать мутантный фенотип или
    наличие активности фермента, полосы белка или фрагмента ДНК. Анализ должен показать генетическую вариацию маркера для картирования локуса на генетической карте, но не для размещения его на физической карте.

    6.5 Аллель

    Две копии аутосомного гена или локуса на материнской и отцовской хромосомах являются аллелями. Если два аллеля идентичны, животное гомозиготно по этому локусу.Когда наследуется генетически
    варианты гена или локуса обнаруживаются любыми способами, различные аллели позволяют проводить генетическое картирование. Одна хромосома может нести только один аллель и, за исключением случаев дупликации,
    После делеции или трисомии животное несет два аутосомных аллеля. В частности, трансген, случайно вставленный в геном, не является аллелем эндогенного локуса; состояние называется гемизиготным
    если трансген присутствует только в одном из двух родительских наборов хромосом. Напротив, ген, модифицированный путем нацеливания на эндогенный локус, является аллелем и должен называться соответствующим образом.

    6.6 Аллельный вариант

    Аллельные варианты — это различия между аллелями, обнаруживаемые любым анализом. Например, различия в анонимных последовательностях ДНК могут быть обнаружены как простой полиморфизм длины последовательности (SSLP) или однонуклеотидный полиморфизм (SNP). Другие типы вариантов включают различия в молекулярной массе или заряде белков, различия в активности ферментов или различия в одноцепочечной конформации (SSCP). Многие аллельные варианты, в частности варианты ДНК, не придают животному какого-либо внешнего фенотипа.Эти варианты часто называют «полиморфизмами», хотя, строго говоря, этот термин применяется только к вариантам с частотой более 1% в популяции.

    6.7 Вариант стыковки или альтернативный стык

    Альтернативный сплайсинг гена приводит к различным, обычно встречающимся формам мРНК, определяемым тем, какие экзоны (или части экзонов) используются. Таким образом, один или несколько альтернативных белковых продуктов могут быть
    производится одним аллелем гена. Среди разных аллелей альтернативные формы сплайсинга могут различаться, а могут и не отличаться, в зависимости от того, влияет ли разница в последовательностях между аллелями на нормальный
    механизм сплайсинга и приводит к различиям в использовании экзона (или частичного экзона).Например, аллель A может продуцировать мРНК формы сплайсинга 1, 2 и 3; в то время как аллель B может продуцировать мРНК сплайсинга
    формы 1, 2 и 4; и аллель C может продуцировать мРНК формы сплайсинга 1, 2 и 3. В этом случае каждый из аллелей A, B и C по определению должен отличаться по своей последовательности ДНК. Однако разница
    Между аллелем B и аллелями A и C должна быть разница в последовательностях, которая влияет на структуру сплайсинга гена.

    6,8 Мутация

    Мутация — это особый класс вариантного аллеля, который обычно придает фенотипически идентифицируемое различие эталонному фенотипу «дикого типа».Однако в некоторых случаях такие
    поскольку когда для нацеливания на ген используется гомологичная рекомбинация, легко идентифицированный фенотип может не дать результата, даже если ген может оказаться нефункциональным.
    В таких случаях гены-мишени, тем не менее, называют мутантными аллелями.

    6,9 Доминантный и рецессивный

    Доминантный и рецессивный относятся к природе наследования фенотипов, а не к генам, аллелям или мутациям. Рецессивный фенотип — это фенотип, который обнаруживается только тогда, когда оба аллеля имеют определенный
    вариант или мутация.Доминантный фенотип обнаруживается, когда присутствует только один вариантный аллель. Если оба аллеля могут быть обнаружены одновременно с помощью анализа, то они являются кодоминантными. Например,
    анализ, который обнаруживает вариации ДНК или белка, почти всегда обнаруживает кодоминантное наследование, поскольку обнаруживаются оба аллеля. Если мутация приводит к фенотипу гетерозиготы,
    промежуточный между гомозиготным нормальным и мутантным фенотипом называют полудоминантным. Одна мутация может давать как доминантный, так и рецессивный фенотип.Например, патч для мыши
    ( Ph ) имеет гетерозиготный (доминантный) фенотип пигментации, но также и гомозиготный (рецессивный) летальный фенотип. Поскольку термины применяются к фенотипам, а не к генам или аллелям, то в
    В случае, когда ген имеет несколько мутантных аллелей, каждый может придавать фенотип, который является доминантным для одних, но рецессивным для других фенотипов из-за других аллелей.

    Пенетрантность — это количественная мера того, как часто фенотип встречается в популяции; а экспрессивность — это мера того, насколько сильно фенотип выражен у человека.В частности, при разделении скрещиваний или там, где существует пороговый эффект на фенотипическое проявление, эти меры предоставляют дополнительные способы описания того, как конкретные комбинации аллелей приводят к фенотипу.

    6.10 Генотип

    Генотип — это описание генетического состава животных, обычно с точки зрения определенных аллелей в определенных локусах. Это может относиться к отдельным генам или локусам или ко многим. Генотип может
    определяться только путем анализа фенотипа, включая тестовое спаривание для выявления носителей рецессивных мутаций.Строго говоря, даже прямое определение вариантов ДНК не является анализом фенотипа.
    генотип, поскольку он зависит от конкретного анализа, хотя он настолько близок к генотипу, что служит суррогатом.

    6.11 Фенотип

    Фенотип является результатом взаимодействия между генотипом и окружающей средой и может быть определен с помощью любого анализа.

    6.12 Локусы количественных признаков (QTL)

    Локусы количественных признаков (QTL) — это полиморфные локусы, содержащие аллели, которые по-разному влияют на выражение непрерывно распределенных фенотипических признаков.Обычно это маркеры, описываемые статистической ассоциацией с количественными вариациями конкретных фенотипических признаков, которые контролируются совокупным действием аллелей в нескольких локусах.

    6,13 Гаплотип

    Гаплотип — это ассоциация генетически связанных аллелей, обнаруженных в гамете. Они могут быть комбинацией маркеров любого типа и могут распространяться на большие, генетически разделяемые
    расстояния или быть на небольшом расстоянии, например, внутри гена и обычно не разделены.

    6,14 Гомолог

    Гены гомологичны, если они явно произошли от общего предка. Обратите внимание, что гены либо гомологичны, либо нет; нет степеней гомологии! Для
    Например, все гены глобина и миоглобин являются гомологами, хотя некоторые из них более тесно связаны друг с другом, чем другие. Когда требуется мера родства между последовательностями, следует использовать процент идентичности или сходства.

    6,15 Ортолог

    Гены у разных видов являются ортологами, если они произошли от одного общего предкового гена.Например, гены бета-глобина мыши, крысы и человека являются ортологами.
    Обратите внимание, что несколько генов мыши или крысы могут иметь один ортолог у другого вида и наоборот.

    6,16 Паралог

    Паралогичные гены — это гены одного вида, которые произошли от общего предка в результате дупликации и последующего расхождения. Например, гены альфа-глобина и бета-глобина мыши являются паралогами.

    6,17 Кластер

    Кластер — это группа геномных объектов, расположенных в непосредственной близости друг от друга на хромосоме.

    7 Ссылки

    Bestor TH. Реанимация транспозонов у мышей. 2005. Cell 122: 322-325.

    Комитет по номенклатуре крыс, сопредседатели Гилл Т.Дж. III, Номура Т. 1992. Определение,
    номенклатура и сохранение линий крыс. Новости ILAR 34: S1-S56.

    Комитет по стандартизированной генетической номенклатуре мышей. 1963. Пересмотр стандартизированной генетической номенклатуры мышей. J. Hered. 54: 159-162.

    Комитет по стандартизированной генетической номенклатуре мышей.1973 г. Руководство по номенклатуре.
    генетически детерминированных биохимических вариантов у домовой мыши Mus musculus. Biochem. Genet. 9: 369-374.

    Комитет по стандартизированной генетической номенклатуре мышей, Председатель: Лион, М.Ф. 1981. Правила и
    рекомендации по номенклатуре генов. В: Генетические варианты и штаммы лабораторных мышей, Green, M.C. (ред.), Первое издание, Густав Фишер Верлаг, Штутгарт, стр. 1-7.

    Комитет по стандартизированной генетической номенклатуре мышей, Председатель: Лион, М.F. 1989. Правила и рекомендации по номенклатуре генов. В: Генетические варианты и штаммы лабораторных мышей, Лион, М.Ф., А.Г. Серл (ред.), Второе издание, Oxford University Press, Oxford, стр. 1-11.

    Комитет по стандартизированной генетической номенклатуре мышей, Председатель: Дэвиссон М.Т. 1996. Правила
    и рекомендации по номенклатуре генов. В: Генетические варианты и
    Штаммы лабораторных мышей, Lyon, M.F., Rastan, S., Brown, S.D.M. (ред.),
    Третье издание, том 1, Oxford University Press, Oxford, стр.1-16.

    ден Даннен Дж.Т., Далглиш Р., Маглотт Д.Р., Харт Р.К., Гринблатт М.С., Макгоуэн-Джордан Дж., Ру А.Ф., Смит Т., Антонаракис С.Е., Ташнер П.Е. (2016). Рекомендации HGVS по описанию вариантов последовательностей: обновление 2016 г. Хум Мутат 37 (6): 564-569.

    Desvignes T, Batzel P, Berezikov E, Eilbeck K, Eppig JT, McAndrews MS, Singer A, Postlethwait JH. 2015. Номенклатура миРНК: взгляд, включающий генетическое происхождение, биосинтетические пути и варианты последовательности. Trends Genet 31: 613-626.

    Дин С, Ву Х, Ли Г, Хань М, Чжуан И, Сюй. T. 2005. Эффективная транспозиция транспозона piggyBac (PB) в клетки млекопитающих и мышей. Ячейка 122: 473-483.

    Данн, Л.С., Х. Грюнеберг, Г.Д. Снелл. 1940. Отчет комитета по номенклатуре генетики мышей. J. Hered. 31: 505-506.

    Дюпюи А.Дж., Акаги К., Ларгаэспада Д.А., Коупленд Н.Г., Дженкинс Н.А. 2005. Мутагенез млекопитающих с использованием высокомобильной соматической транспозонной системы Sleeping Beauty. Природа 436: 221-226.

    Эппиг, JT.2006. Штамм мышей и генетическая номенклатура: сокращенное руководство. В: Fox J, Barthold S, Davvison M, Newcomer C, Quimby F, Smith A (eds) Мышь в биомедицинских исследованиях , том 1, второе издание. Академическая пресса. С. 79-98.

    Gaj T, Gersbach CA, Barbas CF 3 rd . 2013. Методы геномной инженерии на основе ZFN, TALEN и CRISPR / Cas. Trends Biotechnol 31: 397-405.

    Международный комитет по стандартизированной генетической номенклатуре мышей, Председатель: Дэвиссон,
    М.Т. 1994. Правила и рекомендации по генетической номенклатуре мышей. Геном мыши 92 vii-xxxii.

    Леван Г., Х. Дж. Хедрих, Э. Ф. Реммерс, Т. Серикава, M.C. Ёсида. 1995. Стандартизированная генетическая номенклатура крыс. Мамм. Геном 6: 447-448.

    Wijshake T, Baker DJ, van de Sluis B. 2014. Эндонуклеазы: новые инструменты для редактирования генома мыши. Biochim Biophys Acta. 2014 30 апреля

    Типы генов и транскриптов

    Vega показывает аннотации из разных источников и классифицирует гены и
    транскрипты в разные классы.Поскольку один ген часто имеет больше
    чем одна стенограмма, и эти стенограммы могут относиться к разным классам,
    классификация гена в целом определяется транскрипцией
    с «высшим» уровнем классификации.

    Источники аннотаций

    Существует три различных набора источников для аннотации генов и транскриптов в Vega. Эти
    показаны как разные дорожки и имеют разные цветовые схемы.

    • Havana Core Genes были подробно аннотированы для идентификации
      альтернативные транскрипты и присутствуют для всех видов.У них есть
      аннотировано группой Гаваны в WTSI.
    • Гены LoF
      показать последствия изменения последовательности на функционале
      свойства человеческих транскриптов.

    Для каждого из этих наборов гены и транскрипты классифицируются, как показано
    ниже.

    Классификация генов

    Гены можно классифицировать по их статусу ,
    который указывает тип доказательства, поддерживающего аннотацию, и
    их биотип , индикатор биологической
    значение.Для простоты отображения гены окрашены в соответствии с
    только их биотип, например, «Кодирование известного белка» и «Новый белок»
    кодирующие гены показаны одним и тем же оттенком синего.

    Статус:

    • Известный . Идентичны известным кДНК или белкам из тех же
      видов и имеет запись в базах данных конкретных видов: EntrezGene для человека, собаки и свиньи, MGI для мыши, RGD для крысы и Zfin для рыбок данио.
    • Роман .Идентичны или гомологичны кДНК из того же
      виды или белки всех видов.
    • Предполагаемый . Идентичны или гомологичны сращенным EST из
      того же вида.
    • Прогноз . На основе предсказания ab initio и для
      по крайней мере один экзон подтвержден биологическими данными (не сплицированный
      EST, сходство белковой последовательности с геномами мыши или тетраодона или
      данные выражения из Rosetta).
    • Гены могут не иметь статуса показан, если это не применимо, например
      с большинством псевдогенов.

    Биотип:

    • Кодировка белка . Содержит открытую рамку считывания (ORF).
      • Полиморфный . Ген, кодирующий белок, имеющий хотя бы один транскрипт с допустимым
        ORF и один или несколько кодирующих транскриптов, содержащих полиморфизм.
    • Обработанные стенограммы . Не содержит ORF. Разделен на три основных
      категории.

      • Длинная некодирующая РНК (днРНК) .Подклассифицируется на один из следующих типов:
        • Некодирование . Содержит стенограммы, которые
          известно из литературы, что не кодирует белок.
        • 3prime_overlapping_ncRNA . Есть стенограммы, где
          ditag и / или опубликованные экспериментальные данные решительно подтверждают
          наличие длинных (> 200 п.н.) некодирующих транскриптов, которые перекрывают
          3’UTR локуса, кодирующего белок, на той же цепи.
        • Антисмысловой . Имеет стенограммы, которые перекрывают
          геномный диапазон (то есть экзон или интроны) кодирующего белок локуса на
          противоположная прядь.
        • линкРНК (длинно вкрапленная нкРНК) . Имеет длинные стенограммы
          межгенный некодирующий локус РНК длиной> 200 п.н. Требует
          отсутствие кодирующего потенциала и может не сохраняться между
          разновидность.
        • Задержанный_интрон . Имеет альтернативно склеенную стенограмму
          предположительно содержит интронную последовательность относительно других, кодирующих,
          варианты.
        • Sense_intronic . Имеет длинную расшифровку стенограммы без кодирования
          в интронах кодирующего гена, который не перекрывает никакие экзоны.
        • Sense_overlapping . Имеет долгое некодирование
          транскрипт, содержащий кодирующий ген в своем интроне на
          та же прядь.
        • Макро_lncRNA . Несплицированные днРНК, которые
          размером несколько килобайт.
        • Двунаправленная днРНК . Некодирующий локус
          который происходит из промоторной области
          ген, кодирующий белок, с транскрипцией, протекающей в
          противоположное направление на другой пряди.
      • нкРНК
        • miRNA .микроРНК
        • пиРНК . piwi-взаимодействующая РНК
        • рРНК . рибсосомальная РНК
        • миРНК . малая интерферирующая РНК
        • мяРНК . малая ядерная РНК
        • мяРНК . малая ядрышковая РНК
        • тРНК . Переносная РНК
        • vaultRNA . Короткие некодирующие гены РНК, которые
          образуют часть сводчатого рибонуклеопротеидного комплекса.
      • Неклассифицированная обработанная стенограмма . Не может быть
        помещен в одну из других категорий.
    • Псевдоген . Подобен известным белкам, но содержит
      кодон (ы) сдвига рамки считывания и / или стоп-кодон (ы), которые нарушают ORF. Это может быть
      подразделяются на следующие:

      • Обработанный псевдоген . Псевдоген без интронов и
        считается результатом обратной транскрипции мРНК с последующим
        повторная вставка ДНК в геном.
      • Необработанный псевдоген . Псевдоген, который может содержать
        интроны, так как образуются в результате дупликации генов.
      • Расшифрованный псевдоген . Псевдоген, где гомология белков
        или геномная структура указывает на псевдоген, но наличие
        локус-специфические транскрипты указывают на экспрессию. Эти
        может быть отнесен к ‘ Обработанный ‘,
        « Необработанный » и « Унитарный ».
      • Переведенный псевдоген .Псевдогены, имеющие
        данные массовой спецификации, предполагающие, что они также переведены. Эти
        может быть отнесен к ‘ Обработанный ‘,
        Необработанный
      • Полиморфный псевдоген . Псевдоген из-за SNP / DIP
        но у других людей / гаплотипов / штаммов ген
        переведено.
      • Унитарный псевдоген . Видоспецифический необработанный псевдоген без родителя.
        ген, поскольку он имеет активный ортолог у другого вида.
      • IG Псевдоген . Инактивированный ген иммуноглобулина.
    • IG Gene . Ген иммуноглобулина.
    • т.р. Ген. Ген рецептора Т-клеток.
    • TEC (подлежит экспериментальному подтверждению). Используется для
      Кластеры EST без стыков, имеющие свойства polyA. В этой категории есть
      был специально создан для проекта ENCODE, чтобы выделить
      области, которые могут указывать на наличие кодирующего белка
      гены, требующие экспериментальной проверки, либо с помощью 5 ‘RACE, либо
      ОТ-ПЦР для расширения транскриптов или путем подтверждения экспрессии
      предположительно кодируемый пептид со специфическими антителами.

    Классификация стенограмм

    Стенограммы классифицируются в соответствии с их классом.

    • Кодировка белка . Транскрипты, кодирующие белки. Это может быть
      далее классифицируются следующим образом:

      • Кодировка известного белка . 100% идентично записи RefSeq NP или Swiss-Prot.
      • Кодировка нового белка . Доля> 60% длины с известным
        кодирующая последовательность из RefSeq или Swiss-Prot или имеет межвидовую / семейную поддержку или доказательство домена.
      • Кодировка предполагаемого белка . Акции
      • Распад, опосредованный бессмысленностью . Если кодирующая последовательность
        (после соответствующей ссылки) стенограмма заканчивается> 50bp
        с нижележащего сайта сплайсинга, то он помечается как NMD. Если
        вариант не охватывает полную последовательность ссылочного кодирования, тогда он
        обозначается как NMD, если NMD неизбежен, т.е. независимо от того, что
        структура экзона отсутствующей части — транскрипт будет
        подлежит НПРО.
      • Непрерывный распад . Транскрипты с полиА
        особенности (включая сигнал) без предшествующего стоп-кодона в CDS,
        т.е. негеномный полиА-хвост, прикрепленный непосредственно к CDS без
        3 ‘UTR. Эти транскрипты подвержены деградации.
    • Обработанные стенограммы . Не содержит ORF. Разделен на три основных
      категории.

      • Длинная некодирующая РНК (днРНК) .Подклассифицируется на один из следующих типов:
        • Некодирование . Содержит стенограммы, которые
          известно из литературы, что не кодирует белок.
        • 3prime_overlapping_ncRNA . Есть стенограммы, где
          ditag и / или опубликованные экспериментальные данные решительно подтверждают
          наличие длинных (> 200 п.н.) некодирующих транскриптов, которые перекрывают
          3’UTR локуса, кодирующего белок, на той же цепи.
        • Антисмысловой . Имеет стенограммы, которые перекрывают
          геномный диапазон (то есть экзон или интроны) кодирующего белок локуса на
          противоположная прядь.
        • линкРНК (длинно вкрапленная нкРНК) . Имеет длинные стенограммы
          межгенный некодирующий локус РНК длиной> 200 п.н. Требует
          отсутствие кодирующего потенциала и может не сохраняться между
          разновидность.
        • Задержанный_интрон . Имеет альтернативно склеенную стенограмму
          предположительно содержит интронную последовательность относительно других, кодирующих,
          варианты.
        • Sense_intronic . Имеет длинную расшифровку стенограммы без кодирования
          в интронах кодирующего гена, который не перекрывает никакие экзоны.
        • Sense_overlapping . Имеет долгое некодирование
          транскрипт, содержащий кодирующий ген в своем интроне на
          та же прядь.
        • macro_lncRNA . несплайсированные днРНК размером в несколько т.п.н.
      • нкРНК
        • miRNA . микроРНК
        • пиРНК . piwi-взаимодействующая РНК
        • рРНК . рибсосомальная РНК
        • миРНК . малая интерферирующая РНК
        • мяРНК .малая ядерная РНК
        • мяРНК . малая ядрышковая РНК
        • тРНК . Переносная РНК
        • vaultRNA . Короткие некодирующие гены РНК, которые
          образуют часть сводчатого рибонуклеопротеидного комплекса.
      • Неклассифицированная обработанная стенограмма . Не может быть
        помещен в одну из других категорий.
    • Псевдоген .Имеют гомологию с белками, но обычно
      страдают от нарушенной кодирующей последовательности, и активный гомологичный ген может быть
      найдено в другом месте. Иногда эти записи имеют неповрежденный
      кодирующая последовательность или открытая, но усеченная ORF, и в этом случае есть другие доказательства
      используется (например, геномные участки полиА на 3 ‘конце) для классификации
      их как псевдоген. Можно дополнительно классифицировать следующим образом:

      • Обработанный псевдоген . Псевдоген, который, по-видимому, имеет
        были произведены путем интеграции обратно транскрибированной мРНК в
        геном.
      • Необработанный псевдоген . Псевдоген, показывающий доказательства
        потери функции, но имеет экзон-интронную структуру.
      • Расшифрованный псевдоген . Псевдоген, где гомология белков
        или геномная структура указывает на псевдоген, но наличие
        локус-специфические транскрипты указывают на экспрессию. Эти
        можно разделить на « Обработанный » и
        « Необработанный ».
      • Переведенный псевдоген .Псевдогены, имеющие
        данные массовой спецификации, предполагающие, что они также переведены. Эти
        можно разделить на « Обработанный » и
        Необработанный
      • Полиморфный псевдоген . Псевдоген из-за SNP / DIP
        но у других людей / гаплотипов / штаммов ген
        переведено.
      • Унитарный псевдоген . Видоспецифический необработанный псевдоген без родителя.
        ген, поскольку он имеет активный ортолог у другого вида.
      • IG Псевдоген . Инактивированный ген иммуноглобулина.
    • TEC (подлежит экспериментальному подтверждению) . Это используется для
      Кластеры EST без стыков, имеющие свойства polyA. В этой категории есть
      был специально создан для проекта ENCODE, чтобы выделить
      области, которые могут указывать на присутствие нового белка, кодирующего
      гены, требующие экспериментальной проверки, либо с помощью 5 ‘RACE, либо
      ОТ-ПЦР для расширения транскриптов или путем подтверждения экспрессии
      предположительно кодируемый пептид со специфическими антителами.
    • Артефакт . Используется для отметки ошибок в общедоступных базах данных
      (Ensembl / SwissProt / Trembl). Обычно они возникают из
      высокопроизводительные проекты секвенирования кДНК, которые автоматически
      аннотации, иногда приводящие к ошибочным кодовым последовательностям, которые
      представляют собой, например, 3 ‘UTR.
    • IG Gene . Ген иммуноглобулина.
    • т.р. Джин . Ген рецептора Т-клеток.

    От полиморфизма одиночных нуклеотидов к механизму транскрипции

    Abstract

    Полногеномные исследования ассоциации доказали свою высокую эффективность при определении взаимосвязи между полиморфизмами одиночных нуклеотидов (SNP) и клиническими фенотипами при сложных заболеваниях.Установление механистической связи между некодирующим SNP и клиническим исходом является серьезным препятствием для перевода ассоциаций в биологическое понимание. Мы демонстрируем подход к оценке функционального контекста SNP, ассоциированного с диабетической нефропатией (DN), расположенного в промоторной области гена FRMD3 . Подход объединяет анализ путей с моделированием промотора на основе регуляторных паттернов транскрипции и позволяет идентифицировать транскрипционный каркас, на который влияет DN-ассоциированный SNP в промоторе FRMD3 .Эта структура обеспечивает проверяемую гипотезу о механизмах геномной изменчивости и регуляции транскрипции в контексте DN. Наша модель предлагает возможную транскрипционную связь, посредством которой полиморфизм в промоторе FRMD3 может влиять на регуляцию транскрипции в сигнальном пути костного морфогенетического белка ( BMP ). Эти находки служат основанием для исследования биологической связи между FRMD3 и путем BMP и служат примером функциональной геномной генерации гипотезы.

    Хотя полногеномные ассоциативные исследования (GWAS) эффективны при проецировании генетических вариантов на сложный фенотип заболевания, установление соответствующей механистической связи остается трудным. Это особенно верно для однонуклеотидных полиморфизмов (SNP) в небелковых кодирующих областях генома, которые могут влиять на регуляторную функцию способом, очевидным только в конкретном функциональном контексте (1). Одним из таких контекстов может быть биологический процесс, определяемый генами, транскрипция которых синхронизируется общими регуляторными элементами в их промоторах (2,3).SNP, расположенный в одном из этих регуляторных элементов, может изменять или нарушать эту скоординированную регуляцию, что приводит к изменению экспрессии генов и, соответственно, фенотипа. Может оказаться возможным идентифицировать такой механизм через изменение сайта связывания фактора транскрипции (TFBS) с помощью SNP-кандидата; мы демонстрируем эту стратегию для SNP, влияющего на сигнальный путь костного морфогенетического белка ( BMP ), ассоциированного с диабетической нефропатией (DN). Этот подход позволяет нам генерировать проверяемые гипотезы из кандидатов GWAS, попадающих в промоторные области, и может помочь понять функциональное влияние генетических вариантов на DN и другие сложные генетические заболевания.

    DN является основной причиной терминальной стадии почечной недостаточности в США (4), и у ~ 20–40% всех пациентов с диабетом 1 типа (T1D) или диабетом 2 типа (T2D) развивается DN (5–7 ). DN обладает значительной наследуемостью (8), что дает основание для выполнения GWAS для обнаружения генетических локусов, участвующих в DN (9). Первоначальные DN GWAS обнаружили кандидатные генетические локусы для предрасположенности к DN как для T1D, так и для T2D (8,10). Однако эти ассоциации локуса с DN не объясняют, как ассоциированные аллели влияют на механизм заболевания.К сожалению, эта ситуация типична для большинства GWAS сложных генетических нарушений, в то время как локусы, эффекты которых были функционально подтверждены, обычно связаны с менделевскими нарушениями. Примером может служить аутосомно-доминантное заболевание множественных остеохондром, при котором SNP, расположенный в промоторе EXT1 , устраняет TFBS и увеличивает активность промотора (11). Для сложных заболеваний любой крупномасштабный анализ, включающий тесты люциферазы, тесты сдвига электрофоретической подвижности (EMSA) и ELISA, просто невозможен для сотен связанных с заболеванием SNP.Подходы на основе данных, в том числе описанный в этой рукописи, необходимы для определения приоритета числа проверяемых гипотез для дальнейшей экспериментальной проверки.

    Установление функционального контекста SNP важно для определения таких гипотез. Наша группа ранее использовала функциональный контекстный подход для идентификации белков, связанных с щелевой диафрагмой клубочков в DN (12). В этой работе регуляторный модуль, обнаруженный в промоторах нескольких известных генов щелевой диафрагмы, предсказал другие молекулы щелевой диафрагмы после полногеномного поиска промоторов.Здесь наш интегративный подход объединяет предсказание регуляторных SNP, моделирование транскрипционного промотора и анализ путей, способных декодировать предполагаемые транскрипционные патомеханизмы DN (Fig. 1). Мы сосредотачиваемся на домене FERM гена-кандидата, содержащем 3 ( FRMD3 ), идентифицированном GWAS коллекции исследований генетики почек при диабете (GoKinD) (13). В этом исследовании SNP rs1888747 показал самую сильную ассоциацию риска ( P = 4,7 × 10 −7 ; OR = 1,45) с DN у пациентов с СД1.Несмотря на различный дизайн исследований, этот SNP также достиг уровня статистической значимости в повторном исследовании с участием 1305 участников исследования «Контроль диабета и его осложнений / Эпидемиология вмешательств и осложнений диабета» (EDIC), а также в субкогорте японских субъектов с СД2 ( 14). Этот полиморфизм оставался в значительной степени связанным с DN в метаанализе случайных эффектов генетических вариантов, воспроизводимо связанных с DN (15). Кроме того, мы недавно показали, что rs1888747 значительно связан с DN среди 66 больших семейств T2D из коллекции семейств Joslin T2D (16).SNP rs1888747 расположен на хромосоме 9q в расширенной промоторной области FRMD3 . FRMD3 ранее не участвовал в патогенезе DN, T1D или T2D.

    РИС. 1.

    Обзор стратегии анализа ( 2 7 ) для определения предполагаемого регуляторного эффекта кандидата GWAS ( 1 ) на регуляцию FRMD3 ( 2 ), связывая ген с регуляцией транскрипции BMP путь ( 4 7 ) и DN и предлагает гипотетическую регуляторную модель ( 8 ).

    Здесь мы описываем как наш подход in silico, так и его использование для вывода гипотезы о том, что аллель риска DN ставит FRMD3 под контроль предлагаемого модуля регуляции транскрипции и ингибирует почечную экспрессию FRMD3 . Подход не только обнаруживает паттерн регуляции транскрипции, на который влияет кандидатный SNP, но также связывает известные DN-ассоциированные пути с GWAS-производным геном-кандидатом, обеспечивая тестируемую модельную систему для дальнейшего понимания патофизиологии DN.

    ДИЗАЙН И МЕТОДЫ ИССЛЕДОВАНИЙ

    Стратегия.

    Мы предположили, что SNP rs1888747, по сообщениям Pezzolesi et al., Связан с DN. (13) и расположенный в непосредственной близости от FRMD3 , является регуляторным SNP, который изменяет способность связывания фактора транскрипции проксимальной области промотора FRMD3 . Мы предположили, что сайт связывания, предположительно затронутый SNP, является частью молекулярного каркаса TFBS, вовлеченного в это изменение транскрипции, которое также должно сохраняться в промоторах функционально связанных (т.е.д., коваринг) транскриптов. Обнаружение этих транскриптов может позволить нам обнаружить каркас путем включения полиморфизма в промотор FRMD3 и, таким образом, поместить SNP в релевантный для DN функциональный контекст.

    Мы использовали сравнительный анализ промоторов для определения общих регуляторных элементов FRMD3 и его коэкспрессируемых транскриптов. Промоторы функционально связанных транскриптов, вероятно, содержат консервативные (не связанные случайным образом) каркасы TFBS. Связанные с SNP изменения TFBS могут интегрировать геномные особенности с функциями регуляции транскрипции.Подробный обзор нашего исследования и стратегии можно найти на рис. 1.

    Биопсия почек человека.

    Образцы биопсии почек были взяты у 22 участников клинического исследования (17) с расширенным периодом наблюдения, что дает возможность изучить этиологию DN при СД2, а также влияние лечения лозартаном на начало и прогрессирование заболевания. диабетическая болезнь почек. Образцы биопсии почек обрабатывали и анализировали, как описано ранее (12,18,19). Совокупные клинические и гистологические характеристики субъектов приведены в дополнительной таблице 2.

    Экспрессия FRMD3 у субъектов с DN и нормальной или пониженной скоростью клубочковой фильтрации.

    Мы сравнили уровни гломерулярной экспрессии FRMD3 , а также индивидуальные оценки скорости клубочковой фильтрации у 22 индейцев пима с нормальной СКФ с когортой из семи пациентов с СД2 и хронической болезнью почек (ХБП) стадии 3, чтобы оценить, есть ли экспрессия гена FRMD3 . коррелирует с функцией почек. Статистический анализ, сравнивающий две группы, был выполнен с использованием GraphPad Prism 5 с двусторонним тестом t (тест Mann-Whitney U , 95% ДИ). P <0,05 считалось статистически значимым.

    Анализ пути коэкспрессируемых транскриптов

    FRMD3 .

    Когда гены корегулируются в различных биологических условиях, их соответствующие профили -экспрессии могут демонстрировать относительное сходство или коэкспрессию (20). Мы идентифицировали коэкспрессированных транскриптов FRMD3 и путем расчета корреляции по Пирсону r между профилями экспрессии FRMD3 и всеми другими генами, экспрессируемыми выше фона.Эти коэкспрессированные потенциально корегулируемые транскрипты затем анализировали для идентификации транскриптов, о которых известно, что они функционально связаны, с использованием программного обеспечения Ingenuity Pathway Analysis (версия 8.5; Ingenuity Systems, Редвуд-Сити, Калифорния [http://www.ingenuity.com]). Программа обнаруживает расширенные канонические пути в заданном наборе генов. Были применены настройки по умолчанию.

    Функция почек, связанная с

    FRMD3 коэкспрессируемыми транскриптами.

    Был проведен неконтролируемый иерархический кластерный анализ 22 индейцев пима (T2D DN) с использованием уровней экспрессии 581 коэкспрессированных генов FRMD3 (включая FRMD3 ) (МэВ, версия 4.5.1, Евклидово расстояние, метод средней связи). Две основные ветви в дендрограмме показали 100% поддержку (бутстрап, n = 1000). Их дополнительно проанализировали на предмет различий в их экспрессии FRMD3 и и их способности связываться с клиническими и гистологическими подгруппами, так как это связывало бы транскрипты, коэкспрессированные FRMD3 , с фенотипом, связанным с заболеванием. Измерения почечной функции, СКФ иоталамата (iGFR) (в миллилитрах в минуту), измеренные методом мочевого клиренса с использованием холодного йоталамата (21), соотношение альбумина к креатинину (ACR) и фракционная мезангиальная площадь сравнивались между двумя этими измерениями. кластеры.ΔACR / год и ΔiGFR / год были рассчитаны путем вычитания соответствующего значения времени включения в исследование из последнего доступного значения, разделенного на количество лет наблюдения. Дробную мезангиальную площадь определяли, как описано ранее (22). Статистический анализ, сравнивающий две основные ветви кластера, был выполнен с использованием GraphPad Prism 5 с двусторонним тестом t (тест Mann-Whitney U [95% ДИ]). P <0,05 считалось статистически значимым.

    Вычислительный анализ и оценка промоторов.

    Были извлечены

    промоторных областей для восьми FRMD3 , коэкспрессированных членов пути BMP (версия 07/2009; ElDorado, Genomatix), и было выполнено моделирование промоторов для выявления общих транскрипционных регуляторных элементов, на которые потенциально влияет интересующий SNP. Для промотора FRMD3 мы извлекли последовательность из ± 320 нуклеотидов (нт) вокруг интересующего SNP, rs1888747. Длина последовательности 320 нуклеотидов была выбрана, чтобы позволить обнаружение четырехэлементного модуля промотора, начиная с позиции SNP с расчетным средним расстоянием 80 нуклеотидов между центрами двух последовательных элементов.SNP rs1888747 расположен в позиции 85345371 на хромосоме 9 (сборка генома 36.3) в расширенной промоторной последовательности FRMD3 (1904 нуклеотидов, проксимальнее первой области начала транскрипции). Мы определили потенциальный TFBS, генерируемый или потерянный SNP rs1888747 (MatInspector, Genomatix), как описано Cartharius et al. (23). Последовательность промотора FRMD3 анализировали как с аллелем риска, так и без него. Промоторный модуль определяется как набор из двух или более TFBS определенного порядка, ориентации и диапазона расстояний, действующих вместе в определенном функциональном контексте (см. Fessele et al.[2]).

    Мы провели поиск общего модуля среди промоторных последовательностей поднабора из восьми FRMD3 , коэкспрессированных членов пути BMP и измененной по SNP последовательности промотора FRMD3 (FrameWorker, Genomatix). Дисперсия и расстояние между отдельными элементами промотора изменялись до тех пор, пока не был обнаружен модуль с более чем двумя элементами. Нам потребовалось идентифицировать более двух элементов в нашем поиске, поскольку было показано, что более сложные модули связаны с более конкретной биологической функцией (24).Кроме того, промоторный модуль должен был присутствовать по крайней мере в двух из восьми FRMD3 , коэкспрессируемых членами пути BMP , а также в промоторной последовательности FRMD3 в положении rs1888747.

    Мы оценили значимость модуля промотора путем поиска в общегеномной базе данных промоторов человека на предмет дополнительных генов, промоторы которых также будут содержать потенциальные возможности связывания для определенной структуры, идентифицированной на предыдущем этапе (ModelInspector, Genomatix).Для достижения сопоставимых предварительных условий этот поиск был проведен после корректировки промоторной последовательности всех генов в базе данных промоторов (версия 7/2009; ElDorado, Genomatix) (93 372 промотора) до той же длины последовательности, где rs1888747 был обнаружен в промоторе FRMD3 . Дополнительные члены пути BMP , идентифицированные этим подходом, оценивали на предмет их обогащения по сравнению с общим количеством дополнительно обнаруженных генов.

    EMSA.

    EMSA проводили для оценки различий в связывании белков последовательности FRMD3 дикого типа (WT) и последовательности с измененным SNP.Хотя этот метод не позволяет делать выводы о самом фактическом связывающем белке, он является эффективным способом первоначальной оценки регуляторных возможностей SNP в некодирующей области. Были предприняты следующие шаги:

    1. Изоляция клубочков: были выделены клубочки из пяти 3-месячных мышей C57BL / 6J почек (25) с модификациями используемых нейлоновых мембран (нейлоновое сито 100 мкм; Sefar, Briarcliff Manor, Нью-Йорк).

    2. Ядерные экстракты: экстракты ядерных белков из почек и печени взрослых мышей, клубочков, выделенных из почек взрослых мышей, и клеток 293 получали, как описано ранее (2).

    3. EMSA-анализ: олигонуклеотиды, соответствующие последовательности ДНК дикого животного 5′-ACAAGGCTCTGGGAAACCAA C TGGCCATTGTCAACAATAATA-3 ‘или последовательности SNP 5’-ACAAGGCTCTGGGAAGACCAne и 3-концевым участкам, обозначенным TG55GATA и 3-концевым 90-концевым соединением 90GATA GATA и 3-концевым с 32 P-dCTP (26). Экстракты ядерных белков инкубировали в буфере с poly dIdC или poly dAdT и олигонуклеотидом с концевой меткой 10000 имп / мин, как описано ранее (26). Для конкурентных экспериментов немеченую ДНК добавляли к реакциям связывания в 100-кратном избытке радиоактивно меченного олигонуклеотида.Комплексы ДНК-белок разделяли на 6% неденатурирующих полиакриламидных гелях в буфере трис-борат-ЭДТА при 120 В в течение 2,5 часов. Гели сушили и экспонировали на пленке XOMAT (Eastman Kodak) в течение ночи. Интенсивность комплекса ДНК-белок измеряли с использованием программного обеспечения ImageJ 1.44p (NIH, http://imagej.nih.gov/ij/). Парный тест t (GraphPad Prism 5) использовали для оценки значимости средней интенсивности в последовательностях SNP по сравнению с последовательностью WT.

    РЕЗУЛЬТАТЫ

    Определение клинической и функциональной ассоциации

    FRMD3 .

    Чтобы оценить функциональную взаимосвязь между FRMD3 и DN, мы связали стабильные уровни мРНК с доступными параметрами клинического исхода. Мы обнаружили, что уровни транскрипта FRMD3 значительно снижались с прогрессированием DN (среднее ± SD 8,9 ± 1,2 для DN с ХБП 3 стадии по сравнению с 10,3 ± 0,9 для DN с нормальной СКФ [ P <0,02]) (рис. 2 A ).

    РИС. 2.

    A : FRMD3 подавляется с прогрессированием DN. FRMD3 Экспрессия гена сравнивалась у 22 индейцев пима с СД2 и нормальной СКФ с когортой из 7 СД2 с ХБП 3 стадии. Данные представлены в виде средних значений ± стандартное отклонение. Гломерулярная экспрессия FRMD3 в ранней DN (Pima) 10,3 ± 0,9 и в CKD3 DN 8,9 ± 1,2. расчетная скорость клубочковой фильтрации на ранней стадии DN 104 ± 19 мл / мин / 1,73 м 2 и при 3 стадии ХБП DN 53 ± 33 мл / мин / 1,73 м 2 ( P <0,002, Mann-Whitney U тест, 95% ДИ). B : FRMD3 корегулируемые гены разделяют пациентов с DN на определенные подгруппы.Кластерная дендрограмма 581 FRMD3 -коррелированных генов (включая FRMD3 ) в когорте из 22 индейцев пима с T2D DN. Две основные ветви (кластер 1 и кластер 2) дендрограммы демонстрируют 100% поддержку и отражают различные клинические группы (см. D ). C : FRMD3 и корегулируемые члены пути BMP репрессируются в кластере 1. FRMD3 и BMPR2 , CREB1, KRAS, MAP3K7, PRKAR2B, SMAD5, и XI (8 участников пути) значимы (** P <0.008) подавляется в кластере 1 по сравнению с кластером 2 (тест Mann-Whitney U , двусторонний, 95% ДИ). Данные выражения отображаются как среднее ± стандартное отклонение. Клубочковый кластер 1 экспрессии FRMD3 , 8,29 ± 0,54; кластер 2 — 9,67 ± 0,41. D : FRMD3 / Репрессия BMP связана с увеличением альбуминурии. Клинические измерения ΔACR / год при сравнении двух основных ветвей кластера из B . Данные отображаются как среднее ± стандартное отклонение. ΔACR / год кластер 1, 212.4 ± 227,9, значительно (* P = 0,017) увеличилось по сравнению с ΔACR / год в кластере 2, 3,7 ± 8,7. (Тест Манна-Уитни U , двусторонний, 95% ДИ). E : Репрессия FRMD3 / BMP связана с увеличением фракционной мезангиальной площади. Гистологические измерения фракционной мезангиальной площади (%) при сравнении двух основных ветвей кластера из B . Данные отображаются как среднее ± стандартное отклонение. Мезангиальное расширение было значительно (* P = 0,04) увеличено в кластере 1 (30 ± 14%) по сравнению с кластером 2 (17 ± 7%) (тест Mann-Whitney U , двусторонний, 95% ДИ).

    Поскольку FRMD3 не имело ранее связи с DN, мы использовали подход, основанный на данных, чтобы установить предполагаемый клинический и функциональный контекст для FRMD3 в DN. Исходя из списка из 17 589 транскриптов, экспрессированных на микрочипе Affymetrix, 16 956 прошли отсекающий фильтр (медиана + 2 × стандартное отклонение от исходного уровня экспрессии 27 отрицательных контролей Poly-A Affymetrix [27]) и были протестированы на корреляцию с FRMD3 . . Корегуляция транскрипции, организованная общими вышестоящими регуляторными элементами транскрипции (2), послужила обоснованием того, что FRMD3 -коррелированные транскрипты (аналогичные паттерны экспрессии мРНК) могут быть связаны с регуляторными путями в DN, что, в свою очередь, может помочь установить связь между FRMD3 и болезнь.

    Мы идентифицировали 581 коэкспрессированных транскриптов FRMD3 (| r | ≥ 0,65, FDR ≤ 0,02; 10 лучших транскриптов с наивысшим значением | r | см. В дополнительной таблице 1). Большинство (518) из 581 транскриптов FRMD3 , коэкспрессированных FRMD3 , согласованно регулировались FRMD3 , как и топ-10 транскриптов (отсортированных по | r | величине) FRMD3 коэкспрессируемых транскриптов. Для 5 из этих 10 лучших транскриптов или близких вариантов была опубликована ассоциация с диабетом, сердечно-сосудистыми или воспалительными заболеваниями (дополнительная таблица 1), что соответствует значимости этого набора генов для патофизиологии DN.

    Экспрессия

    FRMD3 и его коррелированных транскриптов связана с ранним прогрессированием DN.

    Иерархическая кластеризация с использованием сигнатур экспрессии FRMD3 коэкспрессированных транскриптов обнаружила два различных кластера (фиг. 2 B и C ). Пациенты, входящие в кластер 1, имели значительно ( P = 0,017) более высокий ΔACR / год, 212,4 ± 227,9 по сравнению с кластером 2 (ΔACR / год, равный 3,7 ± 8,7 [рис. 2 D ]). Мезангиальное расширение, ключевой гистологический признак DN (22), было значительным ( P = 0.04) увеличилось в кластере 1 (30 ± 14%) по сравнению с кластером 2 (17 ± 7%) (рис. 2 E ). ΔGFR показала аналогичную тенденцию, но не имела статистической значимости. Время наблюдения было одинаковым в обеих группах пациентов (кластер 1, 9,0 ± 2,2 года; кластер 2, 9,5 ± 0,9 года; P = 0,91). В кластере 1 с более высоким ΔACR / год экспрессия семи из восьми генов пути BMP ( BMPR2, CREB1, KRAS, MAP3K7, PRKAR2B, SMAD5 и XIAP ) была ниже, чем в кластере 2. .Это соответствие регуляции транскрипции членов пути FRMD3 и BMP с показателями почечного исхода указывает на общий молекулярный механизм, ответственный за корегуляцию FRMD3 и нескольких членов пути BMP .

    Анализ пути коэкспрессируемых транскриптов

    FRMD3 .

    Мы определили функциональный контекст FRMD3 и его 581 коэкспрессируемых транскриптов путем сопоставления их с известными каноническими путями.Среди них сигнальный путь BMP оказался путем с наиболее сильным обогащением восемью членами пути BMP , коэкспрессируемыми с FRMD3 ( BMPR2, CREB1, KRAS, MAP3K7, PRKAR1B, PRKAR2209, SMAD5 XIAP ) (рис.3). Это открытие согласуется с предыдущими публикациями, приписывающими DN-защитные свойства пути BMP (rev. В 28,29), и указывает на то, что биологический контекст, определенный для FRMD3 и его коэкспрессируемых транскриптов, действительно может иметь отношение к DN.

    РИС. 3.

    Функциональная ассоциация FRMD3 -коррелированных генов. 10 основных путей (анализ путей изобретательности; системы изобретательности) 581 FRMD3 -коррелированных генов, отсортированных по соотношению членов пути среди FRMD3 -коррелированных генов к общему количеству членов этого пути. P ≤ 0,001 для всех путей. Развязка, примыкание; med., опосредованный; Ox., Окислительный; Pot., Потенцирование; Вывеска., Сигнализация.

    Определение предполагаемой функции SNP.

    Сравнение in silico вариантов последовательностей с и без аллеля риска выявило TFBS потенциального гомеодоменового фактора (HOMF), покрывающего позицию SNP. Этот TFBS не был обнаружен в присутствии аллеля без риска в промоторе FRMD3 (рис. 1, шаг 2). EMSA олигонуклеотидов, соответствующих WT и измененной последовательности SNP гломерулярных экстрактов мышей C57Black6, подтверждает эти прогнозы: последовательность со связанным с заболеванием SNP показывает относительное увеличение> 4,7 раз (интенсивность WT vs.SNP: 1 против 57, 15 против 92 и 31 против 145 соответственно) в связывании белка по сравнению с последовательностью ДНК дикого типа (фиг. 4). Эти результаты показывают, что rs1888747 влияет на связывание с белками, что позволяет предположить генерацию предполагаемого TFBS этим конкретным SNP.

    РИС. 4.

    Повышенное связывание экстрактов ядер клубочков с ДНК-ассоциированной областью генома. EMSA из олигонуклеотидов, соответствующих последовательности ДНК дикого типа и SNP-измененной последовательности (SNP) клубочковых экстрактов мышей C57Black6. Использовали неспецифический конкурент poly (dIdC).Стрелка указывает положение олигонуклеотидов, связанных с белком. При увеличении количества используемого белка в последовательности SNP может быть обнаружен отчетливый сигнал связывания, но в меньшей степени в последовательности WT, как показано в блоте интенсивности. Интенсивность комплекса ДНК-белок в дорожке 2 была установлена ​​равной 1,0. Парный тест t показал, что средняя интенсивность была значительно выше в последовательностях SNP по сравнению с последовательностью WT ( * P = 0,04). прот., протеин.

    Предполагаемый механизм транскрипции для корегуляции

    членов пути FRMD3 и BMP .

    После выделения проксимальных промоторных последовательностей восьми генов BMP , коэкспрессированных с FRMD3 , мы идентифицировали каркасные промоторы, общие для генов BMP , а также промоторную последовательность FRMD3 с аллелем риска. Для FRMD3 и четырех из восьми FRMD3 , коэкспрессированных членов пути BMP ( XIAP, KRAS, PRKAR2B и MAP3K7 ), мы нашли модуль с четырьмя факторами домена TFBS (HOMF, BRNF [Brn POU] , BRN5 [факторы домена Brn-5 POU] и GATA [факторы связывания GATA]), где SNP rs1888747 встречается в первом (HOMF) TFBS FRMD3 (подробности структуры см. На рис.1, шаг 6). Эта структура обеспечивает молекулярную основу для предложенного паттерна корегуляции членов пути FRMD3 и BMP . Полногеномный поиск в базе данных промоторов человека (ModelInspector / ElDorado, Genomatix) выявил дополнительный набор из 18 членов пути BMP , содержащих четыре модуля TFBS в своих промоторах. Анализ обогащения показал, что при обнаружении модуля промотора в 22 (18 вновь идентифицированных плюс 4 исходных участника пути BMP ) из 72 генов пути BMP , аннотированных программным обеспечением Ingenuity Pathway Analysis, было получено 4 балла обогащения.2 и значительный результат z — 7,6. Эти находки предполагают, что четыре промоторных модуля TFBS могут опосредовать транскрипционную корегуляцию членов пути BMP и FRMD3 в функциональном контексте DN. Наши результаты обеспечивают обоснование и экспериментальную основу для определения регуляторной связи между FRMD3 и путем BMP в DN.

    ОБСУЖДЕНИЕ

    С появлением новых возможностей фиксировать генетические и молекулярные основы осложнений диабета, определение заболевания на молекулярной основе может привести к индивидуальной оценке риска и выбору целевых методов лечения (30).Описание взаимодействий генов с окружающей средой станет важным шагом на пути к определению молекулярных болезней. В настоящее время проводится серия исследований, направленных на то, чтобы связать генетические вариации с осложнениями диабета (13,31–33). Генетические варианты могут влиять на фенотип, напрямую изменяя кодирующую последовательность гена, что приводит к качественному изменению кодируемого белка. Альтернативно, варианты могут изменять регуляторные области в геноме, что приводит к количественным изменениям транскрипта. Исследования моногенетических заболеваний установили четкий путь вперед для определения последствий вариантов кодирования белков.Определение последствий регуляторных вариантов для экспрессии генов, особенно при сложных заболеваниях, все еще находится в зачаточном состоянии. Настоящее исследование призвано предоставить один из возможных путей для выявления потенциальных регуляторных эффектов связанных с DN некодирующих вариантов и их связи со сложными регуляторными сетями в DN.

    Анализ регуляторной сети, начинающийся с предполагаемого причинного SNP, должен быть встроен в углубленный анализ функционального контекста затронутого гена. Этот контекст необходим для выявления регуляторных механизмов, представленных каркасами TFBS, активными в регуляторных регионах интересующих генов.В целом, регуляторные SNP можно сделать вывод, если на известную или потенциальную TFBS напрямую влияет полиморфизм (34). Однако, поскольку отдельных TFBS часто недостаточно для регуляторных функций, их функциональный вклад можно оценить только в соответствующем регуляторном контексте, то есть во взаимодействии с другими TFBS (35). Связанные с заболеванием пути и транскрипционная ковариантность могут служить критериями отбора генов, принадлежащих к этому функциональному контексту. Регуляторные связи, выявленные с помощью этого подхода, позволяют прогнозировать изменения транскрипции, которые могут быть проверены в контексте заболевания.

    Эта стратегия, представленная в нашем исследовании, применима всякий раз, когда наблюдается изменение транскрипции гена GWAS и могут быть идентифицированы корегулируемые транскрипционные сети. Однако, хотя это подразумевает обнаружение группы коэкспрессируемых генов, ассоциация путей может не всегда быть такой четкой, как в нашем случае, что может привести к тестированию множества ассоциированных путей с помощью стратегии, представленной выше. Прямое попадание SNP в TFBS является преимуществом, но близости к потенциальной структуре TFBS, скорее всего, будет достаточно для изменения функции TFBS.В случае, если такой каркас не может быть обнаружен с каким-либо ассоциированным путем, можно протестировать альтернативные методы биоинформатики для выбора генов аналогичного функционального контекста, включая сети белок-белковых взаимодействий (36), филогенетическую консервацию (12) или эпигенетические / эпигеномные подходы (37). С увеличением доступности генетического картирования исследований локусов количественных признаков экспрессии в когортах DN, локусы количественных признаков экспрессии будут напрямую связаны с физическим расположением транскриптов, дифференциально экспрессируемых в DN, и тем самым будут поддерживать подходы к моделированию промоторов, как описано в нашем примере (38,39). ).

    Представленное здесь исследование началось с наихудшего сценария, поскольку должна была быть разработана проверяемая гипотеза о роли некодирующего SNP в гене без известной функции в DN. Мы следовали последовательной стратегии интеграции нескольких линий генетических и геномных данных для генерации гипотез (см. Обзор на рис. 1). Во-первых, кандидатный SNP rs1888747 в проксимальной промоторной области FRMD3 побудил нас искать функциональный контекст каркаса TFBS, охватывающий кандидатный SNP.Анализ пути коэкспрессированных транскриптов выявил значительное обогащение пути BMP (40). BMP s являются частью суперсемейства трансформирующего фактора роста-β (41) и играют хорошо известную роль в развитии почек, клеточном росте, дифференцировке клеток, хемотаксисе и апоптозе различных типов клеток (42). Дисбаланс агонистов BMP7 , таких как kielin / chordin-подобный белок, и антагонистов BMP7 , таких как гремлин, был описан в DN (29). Снижение экспрессии BMP7 и его агонистов было связано с повышенной профибротической активностью на животных моделях DN (43), что согласуется с защитным эффектом активации BMP в DN.Моделирование промотора для промоторной последовательности FRMD3 , а также для восьми коэкспрессируемых транскриптов привело к открытию каркаса TFBS, специфичного для пути BMP , который идентифицировал в общей сложности 22 члена пути BMP при полногеномном поиске промоторной последовательности.

    Наши результаты подтверждают гипотезу о функциональной связи SNP со сниженной экспрессией FRMD3 , поскольку сайт связывания, созданный SNP, расположен в вероятном репрессивном модуле промотора.Поскольку этот модуль является общим для регуляторных областей 22 генов пути BMP , гены BMP могут быть подавлены с помощью того же механизма с использованием общего модуля. Аллель риска генерирует необходимые сайты связывания модуля BMP в промоторе FRMD3 и, как и для BMP s, репрессирует FRMD3 с пагубным воздействием на DN, включая ингибирование защитных эффектов пути BMP . . Интересно, что исследование гена-кандидата BMP , проведенное исследовательской группой GoKinD, не смогло идентифицировать статистически значимые DN-ассоциированные SNP в генах BMP2 , BMP4 и BMP7 (44).Вышеупомянутая гипотеза устанавливает трансассоциацию DN-ассоциированного SNP, связывающего гены BMP с риском DN через FRMD3 .

    Предлагаемая модель, соединяющая пути

    FRMD3 и BMP .

    Основываясь на наших выводах, мы разработали проверяемую гипотезу функционального воздействия SNP rs1888747 на DN. Мы предполагаем, что предлагаемая нами структура TFBS обычно является ингибирующей в контексте экспрессии почечных генов и может действовать как отрицательная регуляторная петля обратной связи, чтобы сбалансировать действие пути BMP .Максимальное сокращение всех известных фактов согласуется с идеей о том, что одна из функций FRMD3 заключается в содействии активации экспрессии гена пути BMP , обеспечивая некоторый противовес ингибирующему эффекту каркаса TFBS, определенному для BMP выше. . Это согласуется с наблюдаемой более высокой экспрессией генов BMP в отсутствие аллеля риска. Однако аллель риска ставит FRMD3 под контроль той же отрицательной петли обратной связи BMP , эффективно устраняя положительное влияние FRMD3 на экспрессию BMP .В результате опосредованное BMP защитное действие на почечную ткань и, таким образом, защита почек снижается у лиц с полиморфизмом, что согласуется с наблюдаемым фенотипом DN, связанным с полиморфизмом. Репрессия гена пути FRMD3 и BMP коррелирует с тяжестью почечного фенотипа. Недавние исследования GWAS пациентов с T2D также выявили SNP в области гена FRMD3 , которые связаны с диабетической ретинопатией, что, возможно, связано с однородной связью участников пути FRMD3 и BMP при повреждении конечных органов диабета (45).

    Сильной стороной этого подхода является его способность предсказывать функциональные связи, основанные исключительно на регуляторных сетях, примером которых являются значительно обогащенные транскрипционные каркасы TFBS в отсутствие прямых доказательств на основе белков. В настоящее время мы не знаем, как опосредуется связь между FRMD3 и BMP участниками пути. Мы не нашли доказательств на уровне белка, РНК или микроРНК. Следовательно, FRMD3 , как полагают, влияет на неизвестные в настоящее время регуляторные промежуточные соединения.Даже в этом случае модель обеспечивает объяснение того, как этот SNP может привести регуляцию транскрипции FRMD3 под тот же контроль, что и корегулируемые гены BMP через четыре регуляторных модуля TFBS. Функциональность, выходящая за рамки нашей рукописи, теперь может быть установлена ​​экспериментально in vivo. Представленный здесь модельный подход обеспечивает понимание геномных вариаций и механизмов регуляции транскрипции и обеспечивает основу для целенаправленного эксперимента. FRMD3 , по-видимому, является многообещающей мишенью для этих экспериментов, поскольку данные сравнительного картирования генома также подтвердили, что FRMD3 является геном-кандидатом в нефропатию у мышей (46). Функциональный контекст, предложенный в этом исследовании, может быть экспериментально подтвержден несколькими подходами. Репортерные анализы промотора люциферазы, соответствующие WT и ассоциированным с заболеванием аллелям, могут быть использованы для определения функционального воздействия SNP rs1888747 на экспрессию FRMD3 , а функциональные последствия молчания / сверхэкспрессии гена FRMD3 на экспрессию членов пути BMP могут быть протестировано in vitro.Влияние полиморфизма на DN in vivo можно оценить с использованием мышей, трансгенных по локусу FRMD3 с полиморфизмом, связанным с заболеванием, и без него. Поскольку наши данные обеспечивают функциональную связь участников сигнального пути BMP с другими потенциально связанными с DN путями, такими как IGF-1 и сигнальный путь рецептора инсулина, результаты этих функциональных анализов можно интерпретировать в отношении всех путей, которые, как было показано, обогащены среди . FRMD3 -коррелированные транскрипты.

    Наша работа представляет собой парадигму того, как генерация гипотез на основе функциональной геномики может быть реализована путем пошаговой интеграции предсказания регуляторных SNP, моделирования транскрипционного промотора и анализа путей.Наш модельный подход обеспечивает новую стратегию для расширения понимания механизмов геномной изменчивости и регуляции транскрипции до регуляторных сетей, обеспечивающих последующий экспериментальный дизайн. Общий подход может применяться к различным вопросам в области GWAS и интеграции транскриптомных данных. Этот метод также подходит для анализа экспериментально полученных наборов данных TFBS, таких как данные ChIP-Seq или панели элементов ДНК, связанных с белками in vivo, созданных с помощью геномного следа (47).Более того, информация о модификациях гистонов хроматина, потенциально регуляторных последовательностях или исследованиях филогенетических следов может быть связана с регуляторными сетями. В контексте DN наша работа представляет собой новую отправную точку для генерации гипотез в молекулярной медицине в DN.

    БЛАГОДАРНОСТИ

    Это исследование было частично поддержано грантами R01-DK058549 Национальных институтов здравоохранения компании A.S.K. и K01-DK0

    , выданное M.G.P., Центром почек О’Брайена (P30-DK081943) и Национальным центром интегративной биоинформатики (U54-DA021519) M.K., и от Федерального министерства образования и исследований Германии (01EX1021L) до T.W.

    О потенциальных конфликтах интересов, относящихся к этой статье, не сообщалось.

    С.М. и В. задумал проект, спланировал эксперименты, выполнил анализ транскриптомных данных и подготовил рукопись. S.R.P. провел анализы EMSA и подготовил рукопись. F.E. провел анализ транскриптомных данных. R.G.N. фенотипировал участников из числа индейцев пима, предоставил данные и образцы тканей для исследований экспрессии генов, а также просмотрел и отредактировал рукопись.E.J.W. фенотипировал участников из числа индейцев пима, предоставил данные и образцы тканей для исследований экспрессии генов, выполнил морфометрическую характеристику ткани почек, а также просмотрел и отредактировал рукопись. М.Г.П. подготовил рукопись. ПРОСИТЬ. руководил исследованием. А. провели транскриптомный анализ данных. B.J.K. и Т. подготовил рукопись. М.К. задумал проект, разработал эксперименты, просмотрел и отредактировал рукопись и руководил исследованием. С.М. является гарантом этой работы и, как таковой, имеет полный доступ ко всем данным в исследовании и берет на себя ответственность за целостность данных и точность анализа данных.

    Части этого исследования были представлены в абстрактной форме на симпозиуме Nexus Международного общества нефрологов, Женева, Швейцария, 30 июня — 2 июля 2010 г.

    Авторы благодарят C.V. Коморовскому, специалисту по внутренней медицине и нефрологии, Мичиганский университет, за полезное обсуждение морфометрических данных почек, а также сотрудникам авторов из Дублинского университетского колледжа (Е.П. Бреннан, К. Годсон и Ф. Мартин) за обсуждение функциональных взаимосвязей между Члены пути FRMD3 и BMP.

    • Получено 12 октября 2012 г.
    • Принято 17 февраля 2013 г.
    • © 2013 Американской диабетической ассоциацией.

    Карта транскриптов сои: распределение генов, гаплотип и анализ однонуклеотидного полиморфизма популяции картирования инбредных линий, тем самым обеспечивая картину распределения генных последовательностей по картированной части генома.Однонуклеотидные полиморфизмы (SNP) были обнаружены посредством повторного секвенирования сайтов с меткой последовательностей (STS), полученных из последовательности экспрессируемой метки последовательности (EST). Из первоначального набора из 9459 наборов праймеров для полимеразной цепной реакции, разработанных для разнообразного набора генов, 4240 STS были амплифицированы и секвенированы в каждом из шести различных генотипов сои. В полученной выровненной последовательности 2,44 Мбп было обнаружено всего 5551 SNP, включая 4712 одноосновных изменений и 839 инделей для среднего нуклеотидного разнообразия θ = 0.000997. Анализ наблюдаемых генетических дистанций между соседними генами

    vs . Теоретическое распределение, основанное на предположении о случайном распределении генов по 20 группам сцепления сои, четко указывает на кластеризацию генов. Из 1141 гена 291 картирован в 72 из 112 промежутков размером 5-10 сМ в уже существующей карте, основанной на простых последовательностях (SSR), тогда как 111 генов картированы в 19 из 26 промежутков> 10 сМ. Добавление 1141 генного маркера на основе последовательностей к карте генома сои предоставит генетикам сои важный ресурс для определения локусов количественных признаков и клонирования на основе карт, а также селекционерам сои, которые все больше зависят от селекции с помощью маркеров при улучшении сорта. .

    Генное пространство сои [ Glycine max (L.) Merr.] Еще не определено. Мадж и др. . (2004) подсчитали, что большинство генов сои сосредоточено в ~ 25% генома (275 Мбит / с). Одно из предложений для предоставления информации, относящейся к пространству генов, заключалось в размещении 2000–3000 последовательностей кДНК на физической карте (Stacey et al , 2004). Другой подход заключался бы в генетическом картировании кодирующих последовательностей на существующей карте на основе простых повторов последовательности (SSR) (Song et al .2004 г.). Полученная генетическая карта не только укажет положения кодирующих последовательностей, но также ответит на вопросы о взаимосвязях кодирующих последовательностей с существующими маркерами SSR и RFLP. Эти отношения важны для клонирования на основе карт, определения локусов количественных признаков и улучшения растений с помощью маркеров. Хотя селекционерам и генетикам сои доступен довольно обширный набор из> 1000 генетически картированных SSR-маркеров (Cregan et al .1999; Song et al .2004) на текущей карте 138 пробелов размером> 5 см, в которых нет маркера SSR. Двадцать шесть из этих 138 пробелов имеют размер> 10 сМ, что вызывает беспокойство, если эти области с низкой плотностью маркеров SSR также богаты генами.

    Присутствие SSR в последовательности метки экспрессированной последовательности (EST) обеспечивает одно средство для генетического картирования EST; однако количество EST сои, которые содержат полиморфные SSR, кажется довольно ограниченным. Сонг и др. . (2004) успешно разработали и картировали только 24 полиморфных SSR-маркера из> 136 000 EST сои.В качестве альтернативы, обнаружение однонуклеотидных полиморфизмов (SNP, которые включают одноосновные изменения и вставки / делеции) в генной последовательности могло бы обеспечить источник маркеров, которые можно анализировать с помощью ПЦР и других подходов. Поскольку SNP более многочисленны, чем SSR, они повышают шансы на успех в различных приложениях, включая позиционное клонирование, анализ ассоциаций, картирование QTL и определение генетических отношений между людьми. По состоянию на декабрь 2006 г., почти 28 миллионов человеческих SNP были каталогизированы базой данных SNP Национального центра биотехнологической информации, dbSNP, из которых> 5.6 миллионов были подтверждены. Открытие и применение SNP у видов растений отставало от таковых у людей. Однако темпы открытия и применения SNP увеличились у видов, включая Arabidopsis thaliana (Jander et al .2002; Schmid et al .2003, 2005; Nordborg et al .2005), кукурузу ( Zea mays L.) (Tenaillon et al .2001; Ching et al .2002), рис ( Oryza sativa L.) (Nasu et al .2002; Feltus и др. . 2004), ячмень (Rostoks et al .2005), тополь ( Populus trichocarpa Torr. & Gray) (Tuskan et al .2006) и ряд других видов.

    Двумя важными факторами, влияющими на обнаружение SNP, являются частота вариантов последовательностей и наличие дупликаций генома. Частота вариантов последовательностей у сои низкая из-за исторически сложившихся генетических узких мест и низкого разнообразия последовательностей у дикого предка сои G.soja (Sieb and Zucc.) (Hyten и др. , 2006). Чжу и др. . (2003) сообщили, что частота SNP, измеренная по нуклеотидному разнообразию (θ), составляла ~ 0,00053 в 28,7 т.п.н. кодирующей последовательности, проанализированной в разнообразном наборе из 25 генотипов сои. Нуклеотидное разнообразие в нетранслируемых областях (UTR), интронах и геномной ДНК в непосредственной близости от кодирующей последовательности было более чем в два раза выше (θ = 0,00111). Эти значения аналогичны значениям, полученным у людей (π = 0,000751) из 1.2 миллиарда п.н. выровненной последовательности человека (Sachidanandam et al , 2001), что указывает на то, что, несмотря на низкий уровень вариабельности последовательности, успешное открытие SNP все еще возможно. Кроме того, в GenBank доступно> 356000 последовательностей EST сои, что позволяет предположить, что обнаружение in silico SNP должно быть успешным для сои. Однако обнаружению in silico SNP в сое препятствует природа генома сои и ограниченное генотипическое разнообразие имеющихся данных EST.Нельсон и др. . (2005) предложили анализ in silico данных EST FASTA в качестве подхода к обнаружению SNP у инбредных видов, таких как соя. Однако дублированная природа генома сои и недостаток большого набора данных EST от альтернативных генотипов, а также ошибки секвенирования, присущие данным FASTA, затрудняют обнаружение in silico SNP. В результате дублированной природы генома сои большая часть EST сои являются членами паралогичных наборов экспрессируемых генов.Соя, вероятно, является древним тетраплоидом с числом хромосом 2 n = 40 (Hymowitz 2004). Недавний анализ показывает, что геном сои претерпел два основных события дупликации (Blanc and Wolfe 2004; Schlueter et al . 2004). Это усложняет разработку сайтов с тегами последовательностей (STS), необходимых для повторного секвенирования либо для валидации SNP, производных от in silico , либо для обнаружения de novo SNP. Анализ данных EST для создания набора уникальных генов или унигенов сои может уменьшить проблемы, связанные с дупликациями генома, и ускорить выбор надежных STS.Водкин и др. . (2004) собрали исходный набор из 61 127 уникальных генов сои на основе выравнивания 5′-EST. Затем последовало 3′-концевая секвенирование одной кДНК от каждого из 27 513 генов. Эти данные о последовательностях представляют собой важный ресурс для обнаружения SNP сои.

    Целью этого исследования было разработать STS с использованием EST и 3′-унигеновой последовательности, а затем использовать STS для обнаружения SNP посредством ресеквенирования шести различных генотипов сои. SNP были обнаружены в> 2000 STS, и> 1000 SNP, полученных из генной последовательности, были генетически картированы для создания карты транскриптов, которая обеспечивает определение пространства генов сои на основе карты и будет играть ключевую роль в сборке всего генома. последовательность дробовика.

    МАТЕРИАЛЫ И МЕТОДЫ

    Растительные материалы:

    Zhu et al . (2003) показали, что анализ последовательности шести различных генотипов сои Archer, Minsoy, Noir 1, Evans, PI 209332 и Peking позволит обнаружить 93% общих SNP (частота> 0,10), обнаруженных в разнообразной группе из 25 генотипов. . Среди этих шести генотипов — родители четырех популяций картирования рекомбинантных инбредных линий (RIL), используемых в наших лабораториях. ДНК шести генотипов выделяли из объемной ткани листа, как описано Keim et al. .(1988).

    Выбор праймеров для ПЦР в кластерах EST:

    Все EST, доступные по состоянию на август 2003 г., полученные из сортов Williams и Williams 82, были сгруппированы с использованием программы сборки CAP3 с требованием, чтобы все EST в кластере имели сходство> 95%. Затем каждый из кластеров был индивидуально проанализирован на наличие полиморфизмов высокого качества Phred. Все подобные последовательности в кластере были дополнительно сгруппированы в меньшие наборы похожих последовательностей, которые, вероятно, были паралогами.Были идентифицированы варианты последовательностей паралогов (PSV), и были сконструированы праймеры, включающие PSV на 3′-конце праймеров с целью обеспечения паралог-специфической амплификации. Праймеры были выбраны с помощью Primer3 (Whitehead Institute, Massachusetts Institute of Technology, MIT).

    Выбор праймера ПЦР в 3′-унигенной последовательности:

    ПЦР-праймеров были сконструированы для 8587 3′-концевых унигеновых последовательностей сои, депонированных в GenBank в результате работы, описанной Vodkin et al. .(2004) с диапазоном предсказанных длин фрагментов от 300 до 800 п.н. Всего 5798 праймеров было разработано с помощью OLIGO (National Biolabs, Сент-Пол) и Array Designer 2 (Premier Biosoft International, Пало-Альто, Калифорния) с использованием только данных FASTA, в то время как 2789 наборов праймеров были разработаны с использованием Primer 3 (Whitehead Institute, MIT). с использованием данных FASTA и показателей качества Phred. При использовании показателей качества все основания в праймерах должны были иметь минимальный показатель качества 20. В попытке обеспечить специфичность обратный праймер располагался как можно дальше от 3′-конца последовательности кДНК с целью максимизация вероятности прайминга из 3 ‘UTR.

    Предварительный анализ праймеров для ПЦР:

    Каждую пару праймеров использовали для амплификации геномной ДНК сои Archer. Реакции амплификации проводили с 20 нг ДНК, 0,1 мкм прямого и обратного праймеров, 1 × FailSafe PCR PreMix B буфера (Epicenter Technologies, Мэдисон, Висконсин) или буфера, состоящего из 20 мМ трис-HCl (pH 8,0), 50 мМ. KCl, 200 мкМ каждого dNTP, 1,0% глицерина, 1,5 мм MgCl 2 , 2,0 нг / мкл одноцепочечного ДНК-связывающего белка и ДНК-полимераза Taq в реакционном объеме 10 мкл (45 секунд при 92 °, денатурация; 45 секунд при 58 °, отжиг и 45 секунд при 68 °, удлинение) на 40 циклов.Продукты ПЦР разделяли на 2,5% агарозном геле, окрашенном бромидом этидия. Реакции, которые не давали продукта или несколько продуктов, были повторно усилены либо более низкой (без продукта), либо более высокой (несколько продуктов) температурой отжига. Пары праймеров, которые амплифицировали один дискретный продукт, были выбраны для дальнейшего анализа.

    Ампликон из каждой выбранной пары праймеров был подготовлен для анализа последовательности путем обработки 4 единицами щелочной фосфатазы креветок (SAP) и 4 единицами экзонуклеазы I, инкубированных при 37 ° в течение 1 часа, а затем при 72 ° в течение 15 минут для дезактивации ферментов. .Реакции мечения проводили с 1 мкл продукта ПЦР, 0,5 мкл BigDye Terminators, версия 1.1 или 3.1 (Applied Biosystems, Foster City, CA), 0,3 мкм одного из исходных праймеров для ПЦР, 1 × Taq ДНК-полимеразный буфер (Promega, Мэдисон, Висконсин) и 1,75 мм MgCl 2 в реакционном объеме 5 мкл (10 секунд при 90 °, денатурация; 5 секунд при 50 °, отжиг; 60 секунд при 60 °, удлинение) в течение 40 циклов. Продукты ПЦР метили с обоих концов, и полученные продукты терминации анализировали на анализаторе ДНК ABI 3730.Две полученные следы последовательности, полученные с противоположных концов каждого ампликона, были проанализированы и сопоставлены с помощью стандартного программного обеспечения для анализа ДНК Phred (Ewing and Green 1998) и Phrap (http://www.phrap.org/). Полученные в результате выравнивания и данные трассировки визуально просматривали в Consed viewer (Gordon et al , 1998), чтобы различить те ампликоны, которые были локус-специфичными, и те, которые, по-видимому, возникли в результате амплификации двух или более паралогичных локусов. Те наборы праймеров, которые дали то, что, по-видимому, было ампликонами с одним локусом, были использованы для ПЦР-амплификации геномной ДНК других пяти генотипов сои Minsoy, Noir 1, Evans, PI 209332 и Peking.Полученные ампликоны обрабатывали SAP и экзонуклеазой I, как описано выше, с последующим анализом последовательности на ABI 3730. Следы прямой и обратной последовательности от пяти генотипов, а также от Archer анализировали и выравнивали, как описано выше. Обнаружение SNP было выполнено при выравнивании последовательностей с помощью алгоритма машинного обучения, основанного на программном обеспечении обнаружения SNP PolyBayes (Marth и др. . 1999; Matukumalli и др. . 2006a).

    Анализ последовательностей для проверки STS и обнаружения SNP:

    Следы последовательностей для каждого предполагаемого идентифицированного SNP были визуально проверены для проверки полиморфизма последовательностей.Однонуклеотидные изменения и инделки, присутствующие в каждом выравнивании, а также гаплотипы, присутствующие среди шести генотипов, регистрировали, как описано Matukumalli et al . (2006b).

    Анализ интронов:

    Консенсусную последовательность, полученную в результате выравнивания Phrap шести генотипов сои, выровняли с последовательностью EST, для которой были сконструированы праймеры, с помощью программы выравнивания программного обеспечения bl2seq (http: //www.ncbi.nlm.nih. gov) для определения наличия и длины интронов.

    Генетическое картирование локусов, содержащих SNP:

    Один SNP был картирован из содержащих SNP STS, полученных из кластеров EST и 3′-унигенной последовательности, а также из последовательности генов сои, депонированных в GenBank. Аллель, присутствующий в каждом локусе SNP, определяли с использованием одноосновного удлинения либо на платформе Sequenom MassARRAY, либо на проточном цитометре Luminex. Система MassARRAY основана на технологии одноосновного удлинения праймера. В технологии MassARRAY используется масс-спектрометрия с лазерной десорбцией-ионизацией с использованием матрицы и временем пролета (MALDI-TOF) для непосредственного измерения массы продукта (ов) удлинения, а затем корреляции обнаруженной массы с конкретным генотипом (Griffin et al .1999). Подробная информация о протоколе доступна на веб-сайте Sequenom: http://www.sequenom.com/applications/hme_assay.php. Технология расширения с одним основанием также использовалась для картирования локусов, содержащих SNP, на проточном цитометре Luminex, как описано Chen et al . (2000). SNP были нанесены на карту в трех различных картированных популяциях, включая Университет штата Юта Минсой × Нуар 1 (M × N) и Минсой × Арчер (M × A), а также Evans × PI 209332 (E × PI) (Concibido et al 1996 г.) Картирование популяций RIL.Первые две популяции были использованы при создании текущей интегрированной карты сцепления (Song et al , 2004). Всего 89 RIL из популяции M × A были проанализированы с использованием технологии MassARRAY и системы проточной цитометрии Luminex. В случае популяции M × N 89 RIL были проанализированы с использованием генотипирования MassARRAY, а 75 RIL были генотипированы с использованием проточного цитометра Luminex. Для генетического картирования использовали в общей сложности 77 F 6 -производных RIL из E × PI. SNP в 500 генах в генах M × N и 501 в популяциях M × A, соответственно, были проанализированы с использованием системы MassARRAY.SNP в 337 генах в M × N и 128 генах в популяциях M × A, соответственно, были проанализированы с использованием проточного цитометра Luminex. Сто сорок шесть генов были картированы в популяции E × PI с использованием проточного цитометра Luminex. В общей сложности 233 SNP в M × N и 115 SNP в M × A популяциях были генотипированы с использованием обеих платформ анализа. В тех случаях, когда один и тот же SNP был нанесен на карту с использованием систем MassARRAY и Luminex, при построении карты использовались данные генотипирования с наименьшим количеством отсутствующих данных.Чтобы предоставить набор маркеров, общих для трех картируемых популяций, для ускорения анализа сцепления JoinMap, 77 RIL Evans × PI 209332 были генотипированы по 155 локусам SSR с использованием системы анализа, описанной Wang et al . (2003).

    Статистический анализ:
    Нуклеотидное разнообразие:

    Нуклеотидное разнообразие (θ) оценивали согласно Halushka et al . (1999), где K — количество SNP, идентифицированных при выравнивании генотипов n , длиной L п.н.Нуклеотидное разнообразие определяли как в интроне, так и в экзонной последовательности.

    Разнообразие гаплотипов:

    Разнообразие гаплотипов было рассчитано таким же образом, как и расчет разнообразия генов (Weir 1996), где P ij — частота гаплотипа j для локуса i . суммированы по всем гаплотипам в локусе.

    Распределение SNP в STS:

    Чтобы определить, были ли SNP равномерно распределены в анализируемых фрагментах, теоретическое кумулятивное частотное распределение SNP для SNP было рассчитано на основе предположения о равномерном распределении.Это распределение сравнивалось с реальным кумулятивным распределением частот в этих фрагментах с использованием критерия Колмогорова – Смирнова (KS) (Гиббонс, 1976). Тест KS оценивал степень соответствия между выборкой эмпирически собранных значений и целевым теоретическим распределением.

    Построение консенсусной карты:

    Наборы данных для анализа JoinMap состояли из 1023 маркеров A81-356022 × PI 468916, 1610 M × N, 1072 M × A и 374 маркеров E × PI. Из 2807 уникальных маркеров в наборах данных всего 533, 212 и 36 маркеров были общими для двух, трех и четырех популяций соответственно.Маркеры в каждой из четырех популяций были сгруппированы отдельно на основе их показателей LOD, а затем интегрированы с использованием JoinMap (Van Ooijen and Voorrips 2001). Группы сцепления сои были идентифицированы с использованием буквенно-цифровых кодов, описанных Cregan et al . (1999) и Сонг и др. . (2004). Значения рекомбинации были преобразованы в генетические расстояния с использованием функции картирования Косамби.

    Распределение генных последовательностей — критерий согласия теоретического и наблюдаемого количества вновь картированных генов для каждой группы сцепления:

    Статистика хи-квадрат обычно используется для проверки согласия наблюдаемого и теоретическое распределение.Однако проверка каждой отдельной группы сцепления проблематична из-за нулевых степеней свободы. Поэтому был разработан алгоритм перестановки для оценки уровня значимости. Для каждой перестановки в общей сложности 1141 маркер SNP случайным образом был назначен на любую позицию общей длиной 2388,61 сМ (общая длина 20 групп сцепления) с интервалами 0,01 см. Теоретическое количество генов, назначенных каждой группе сцепления, сравнивали с наблюдаемым количеством генов, картированных в каждой группе сцепления для каждой из 5000 перестановок.Вероятность согласия измерялась долей раз, когда наблюдаемое количество генов в каждой группе сцепления было больше или меньше ожидаемого.

    Распределение генов внутри групп сцепления:

    Теоретическое распределение расстояний карты между соседними генными последовательностями в группах сцепления оценивалось на основе предположения о случайном распределении маркеров по общей длине карты сцепления. Степень соответствия между наблюдаемым и теоретическим распределениями проверялась с помощью анализа хи-квадрат.

    Распределение генов по сравнению с локусами SSR и RFLP:

    Для оценки относительной близости генов на недавно разработанной карте транскриптов с уже существующими локусами SSR и RFLP, генетическое расстояние между каждым локусом SSR и RFLP и двумя фланкирующими генными локусами был определен. Генные локусы включали как локусы, картированные в этом исследовании, так и классические гены, которые были ранее картированы, и 37 генов, которые были картированы благодаря SSR, который они содержали. SSR в этих 37 генах не были включены в анализ.Пропорции генетических дистанций, которые попали в классы 0,0–0,1 см, 0,1–0,2 см, 0,2–0,3 см и т. Д., Были рассчитаны как для SSR , так и для . гены и для RFLP против . гены. Пропорции генетических дистанций в различных дистанционных классах позволили сравнить относительную генетическую близость локусов SSR и RFLP к соседним генам.

    РЕЗУЛЬТАТЫ

    SNP в кластерах EST:

    Всего 160 000 EST сортов Williams и Williams 82 были сгруппированы с использованием CAP3, а затем сгруппированы в подмножества, которые, как считается, соответствуют паралогам.Затем были разработаны праймеры для полиморфизма высокого качества Phred с целью обеспечения специфичности паралогов. Из 872 протестированных праймеров одна треть не дала ампликона, а 516 (59,2%) дали единственную полосу на агарозе (таблица 1). После анализа последовательности этих ампликонов в генотипе Archer 367 (42,1%) дали в целом высококачественные данные о последовательностях, позволяющие выровнять 5′- и 3′-следы. В ряде случаев следы последовательности содержали позиции, которые казались «гетерозиготными», указывающие либо на вариацию гаплотипа, либо на вариацию между очень похожими гомеологичными локусами.367 пар праймеров, которые дали данные о последовательностях хорошего качества, использовали для амплификации соответствующего фрагмента из пяти дополнительных генотипов Minsoy, Noir 1, Evans, Peking и PI 209332 с последующим анализом последовательности с обоих концов. Сопоставление и анализ этих следов последовательности с таковыми из сои Archer показал, что 46 фрагментов, которые содержали гетерозиготные положения в сои Archer, также имели идентичные гетерозиготные основания в тех же положениях в каждом из пяти других генотипов. Типичный пример этого явления проиллюстрирован на дополнительном рисунке 1 по адресу http: // www.genetics.org/supplemental/ и предположил, что это вариация PSV, а не вариация гаплотипа. Анализ оставшихся 321 выравнивания показал, что они были результатом амплификации из одного локуса, , то есть ., STS. Сто восемьдесят один из этих STS содержал один или несколько интронов, а 225 (25,8% из 872 проанализированных пар праймеров) содержали по крайней мере одно одноосновное изменение или индел, как обнаружено с помощью PolyBayes и подтверждено визуальной проверкой выравнивания. В 321 STS было 214.2 т.п.н. выровненной последовательности и нуклеотидное разнообразие θ = 0,001396.

    ТАБЛИЦА 1

    Количество разработанных праймеров для ПЦР и результаты ПЦР и анализа последовательностей в шести генотипах сои

    Обнаружение SNP в праймерах, разработанных для 3′-унигеновых последовательностей Данные:

    В попытке повысить специфичность праймера, 3 ‘ Данные о последовательности унигена использовали при конструировании праймера, так что один праймер располагался как можно дальше от 3’-конца унигена. Из этих праймеров, разработанных по данным FASTA, 24.2% не дали продукта ПЦР, что немного выше, чем 21,6%, которые не дали продукта ПЦР, когда показатели качества использовались при разработке праймера (Таблица 1). Доля наборов праймеров, которые амплифицировали множественные или паралогичные локусы, немного различалась между двумя группами. Однако доля пар праймеров, которые привели к STS, когда праймеры были сконструированы для секвенирования с показателем Phred ≥20, составила 49,2%, что было больше, чем 43,9% успешных STS, полученных, когда праймеры были сконструированы для последовательности FASTA.

    Всего было сконструировано 8587 наборов праймеров для 3′-унигенной последовательности, из которых 4346 дали высококачественные данные о последовательности на основе анализа STS, амплифицированных из геномной ДНК сои Archer. Как и в случае с праймерами, разработанными для кластеров EST, ряд следов последовательности содержал гетерозиготные положения. Последующий анализ 4346 ампликонов пяти генотипов Minsoy, Noir 1, Evans, Peking и PI 209332 показал, что в 427 сопоставлениях следов шести генотипов каждый из генотипов имел «гетерозиготы» в одних и тех же положениях, что указывает на эту вариацию. находился между паралогами, как описано ранее и проиллюстрировано на дополнительном рисунке 1 по адресу http: // www.genetics.org/supplemental/. Всего 3919 праймеров, сконструированных для 3′-унигенной последовательности, привели к тому, что оказалось устойчивым STS, как показал анализ последовательности шести генотипов, и 1807 из них содержали по крайней мере один SNP. Таким образом, 21% протестированных пар праймеров привели к получению ампликона, содержащего SNP.

    Множественные ампликоны:

    Всего 22,7% разработанных и протестированных праймеров продуцировали (1) множественные продукты на агарозном геле (9,2%), (2) множественные ампликоны, как определено анализом последовательности (8.5%) или (3) доказательства PSV, как показано на дополнительном рисунке 1 на http://www.genetics.org/supplemental/ (5,0%).

    Неоднородность нуклеотидного разнообразия среди генов:

    Анализ 9459 пар праймеров привел к развитию 4240 сайтов с метками последовательностей со средней длиной 575 п.н. и средним значением 1,31 SNP на фрагмент. Нуклеотидное разнообразие в выровненной генной последовательности, равной 2,44 мбп, составило θ = 0,000997. Более половины фрагментов гена не имели вариации последовательности, что свидетельствует о неравномерном распределении вариации последовательности между фрагментами.Тест Колмогорова-Смирнова был проведен для сравнения наблюдаемых кумулятивных частотных распределений SNP во фрагментах с теоретическими распределениями, основанными на предположении, что мутации равномерно распределены по 4240 фрагментам. Было определено, что наблюдаемые и теоретические частотные распределения значительно различаются ( P <0,01), что указывает на неоднородность нуклеотидного разнообразия фрагментов генов, проанализированных в этом исследовании.

    Характеристики SNP в экзонах и интронах:

    Выровненная последовательность 4240 STS привела к открытию 5551 SNP (таблица 2).Анализ выровненной последовательности показал, что 91,6 т.п.н. (37,6%) представляет собой интронную последовательность со средним значением 1,64 интрона на фрагмент гена и средней длиной интрона 279 п.н. Количество интронов на фрагмент гена варьировало от 1 до 8, и было 2,66 SNP / kbp в интронах против . 2,04 SNP / kbp в экзонной последовательности. Таким образом, нуклеотидное разнообразие интрона (θ = 0,001168) было несколько больше, чем в экзонах (θ = 0,000895). Примерно 85% SNP были изменениями на одной основе, из которых 55.7% были переходами и 44,3% трансверсиями. В пяти случаях триаллельные одноосновные изменения были обнаружены в шести генотипах. Остальные 15% SNP представляют собой индели длиной от 1 до 104 п.н., из которых 14,3% имеют длину> 5 п.н., а 4,8% — длину> 10 п.н. Пятьдесят один процент из 827 инделей имели длину 1 п.н. Распределение длин инделей в экзонах и интронах показало, что доля инделей в разных классах длины была довольно похожей в экзонах и интронах (рис. 1).Доля инделей размером 1, 2 и> 10 п.н. в интронах была немного выше, в то время как доля инделей из 3 и 6 п.н. была больше в экзонах. Информация, относящаяся к каждому из 2032 SNP-содержащих STS и 5551 SNP, обнаруженных в результате анализа повторного секвенирования, представлена ​​на http://bfgl.anri.barc.usda.gov/soybean/ (файлы: 2032-SNP-contains STS.xls и 5551-SNPs-2032 STS.xls).

    Рис. 1.—

    Распределение длин инделей среди 839 инделей, обнаруженных в 4240 сайтах с тегами последовательностей, составляющих 2.44 Mbp выровненной генной последовательности.

    ТАБЛИЦА 2

    Характеристики SNP в генной последовательности сои

    Разнообразие гаплотипов:

    Среди шести проанализированных генотипов только два гаплотипа были обнаружены в 1502 (73,9%) из 2032 фрагментов гена, которые содержали вариант последовательности ( Таблица 3). Только два гаплотипа были обнаружены в 837 фрагментах с одним вариантом последовательности, а также во многих с несколькими SNP. Четыре или более гаплотипа наблюдались в <5% фрагментов гена.В 2032 генах, содержащих SNP, было в среднем 2,31 гаплотипа. Разнообразие гаплотипов во фрагментах генов, содержащих два и более SNP, составило 0,48 ± 0,13.

    ТАБЛИЦА 3

    Число гаплотипов в 2032 фрагментах генов, содержащих SNP

    Молекулярная функция генов:

    Поскольку гены были выбраны случайным образом, ожидалось, что в это исследование будет включен разнообразный набор генов. Это ожидание было реализовано, как показано на рисунке 2. Были небольшие различия между пропорциями генов в различных классах предсказания генов, для которых были разработаны праймеры и .STS развивались в отличие от тех, в которых было обнаружено разнообразие последовательностей, позволяющих проводить генетическое картирование. Например, около 12% генов, для которых были разработаны праймеры, относились к категории каталитической активности, тогда как 14% картированных локусов относились к этой категории. Точно так же было предсказано, что 1,3% генов, для которых были разработаны праймеры, функционируют при передаче сигнала, тогда как только 0,52% этих генов были картированы. В целом, для большинства категорий прогнозирования генов такие различия были относительно незначительными.

    Рисунок 2.—

    Прогнозируемые молекулярные функции анализируемых генов.

    Генетическое картирование STS:

    Всего на генетическую карту было помещено 1141 ген благодаря сегрегации SNP, картированной в одной или нескольких из трех картирующих популяций RIL. В случае популяции M × A 115 SNP были картированы с использованием как технологии Sequenom Mass Spectrometer MassARRAY, так и проточного цитометра Luminex на одном и том же наборе из 89 RIL. Более 98,5% вызовов генотипа RIL были идентичны при использовании обеих платформ обнаружения SNP.Локусы были размещены на существующей каркасной карте, которая состоит из 1015 SSR и 709 локусов RFLP (Song et al. , 2004). Генетическая карта с SSR, RFLP, SNP и другими локусами представлена ​​в файле дополнительных данных 1 по адресу http://www.genetics.org/supplemental/. На основе длин 20 групп сцепления на каркасной карте было определено прогнозируемое количество генов, картированных на группу сцепления, предполагая случайное распределение генов. Значительно более высокая, чем предполагалось, плотность генов произошла в 3 из 20 групп сцепления (E, J и K) (Таблица 4), в то время как меньшее, чем ожидалось, количество генов, картированных в группе сцепления M.Дополнительный анализ был предпринят для определения характера распределения генов внутри групп сцепления. Анализ теоретического распределения карт расстояний между соседними генными последовательностями ясно показал, что гены были сгруппированы (рис. 3).

    Рисунок 3.—

    Наблюдаемое распределение расстояний на карте между соседними генными последовательностями внутри групп сцепления и теоретическое распределение, основанное на предположении о случайном распределении маркеров по всей длине карты сцепления.

    ТАБЛИЦА 4

    Существующие длины групп сцепления, количество SSR, RFLP и другие типы маркеров, включая RAPD, AFLP, а также классические и изоферментные локусы в Song et al. . (2004) консенсусная карта генетического сцепления и недавно картированные гены

    Распределение генов

    против . Локусы SSR и RFLP:

    Для оценки относительной близости генов на недавно разработанной карте транскриптов к уже существующим локусам SSR и RFLP были определены генетические расстояния каждого локуса SSR и RFLP до двух ближайших фланкирующих генных локусов.График пропорции локусов SSR и RFLP, которые попадают в различные интервалы от двух ближайших фланкирующих генов, предполагает небольшую разницу между близостью локусов SSR и RFLP к генам (Рисунок 4). Однако более высокая доля SSR оказалась очень близкой (0,0–0,5 сМ) к генам, чем локусы RFLP. Кроме того, корреляции количества генов с SSR и генов с RFLP в 20 группах сцепления сои указали на умеренно сильную взаимосвязь между плотностью SSR и плотностью генов.Корреляция количества SSR на группу сцепления с генами на группу сцепления составила r = 0,58 ( P = 0,0075), тогда как соотношение между количеством локусов RFLP и генных локусов было значительно ниже, r = 0,25 ( P = 0,29). Вместе эти данные предполагают очевидную связь между SSR и генной последовательностью.

    Рисунок 4.—

    Пропорция интервалов между локусами SSR (синие линии и треугольники) и локусами RFLP (фиолетовые линии и прямоугольники) и ближайшими фланкирующими генными последовательностями, которые попадают в сантиморганные расстояния 0–0.От 1 см, 0,1–0,2 см, 0,2–0,3 см и т. Д. До 35 см.

    Пробелы в карте сцепления теперь заполнены маркерами SNP:

    В песне и др. . (2004), всего 112 и 26 интервалов между соседними маркерами SSR составляют> 5 и 10 сМ, соответственно. На новой карте в общей сложности 291 ген был картирован в 72 из 112 промежутков с расстояниями от 5 до 10 сМ, а 111 генов были картированы в 19 из 26 промежутков> 10 сМ. Таким образом, маркеры на основе последовательностей эффективно заполняли многие пробелы между ранее существовавшими маркерами на основе последовательностей в карте сцепления.

    База данных SNP сои:

    Для обеспечения доступа через Интернет к сопоставленным маркерам SNP, сгенерированным в этом исследовании, была создана база данных, доступ к которой можно получить по адресу http://bfgl.anri.barc.usda.gov/soybean/ . Информация включает в себя описательные данные для каждого SNP-содержащего STS, информацию STS, включая последовательности праймеров и положения SNP в STS, а также аллель, присутствующий в каждом из шести генотипов. Также доступна полная интегрированная карта с положениями всех локусов SSR, RFLP и SNP.Кроме того, в база данных.

    ОБСУЖДЕНИЕ

    Обнаружение SNP в сое:

    Из всего 9459 наборов праймеров, разработанных для последовательности EST и исследованных для амплификации локус-специфической ПЦР с последующим повторным секвенированием для обнаружения SNP, 21.Было установлено, что 5% содержат вариант последовательности. Низкая скорость обнаружения SNP, о которой здесь сообщается, была, во-первых, результатом неспособности разработать надежные STS, а, во-вторых, результатом низкого уровня вариабельности последовательностей в культивируемых соевых бобах. Сложность развития СТС связана с рядом факторов. Для облегчения специфичности 872 праймера, разработанные для EST, кластеризованных с использованием CAP3, часто содержали PSV на своем 3′-конце. В некоторых случаях основания PSV могли быть ошибками обратной транскриптазы, что привело бы к плохой или отсутствующей ПЦР-амплификации.Ошибки обратной транскриптазы обнаруживаются при частотах 1 / 1000-4000 оснований в синтезе кДНК у Drosophila (Stapleton et al . 2002). Дизайн праймера по сайтам сплайсинга интрон-экзон также снизит успешность ПЦР-амплификации праймеров, разработанных для последовательности EST. Точно так же высокий уровень дупликации в геноме сои усложнил разработку STS. Более 20% разработанных праймеров продуцировали либо множественные ампликоны, как определено анализом в агарозном геле, либо однополосные ампликоны, которые давали следы, указывающие на наличие двух или более ампликонов.Этого можно было ожидать в свете сообщений о том, что в среднем данный хромосомный сегмент дублируется в геноме сои 2,55 раза, а некоторые сегменты присутствуют до шести раз (Shoemaker et al . 1996).

    Относительно низкое нуклеотидное разнообразие культивируемой сои также усложняет обнаружение SNP. В выровненной последовательности 2,44 Мбп нуклеотидное разнообразие (θ = 0,000997) было таким же, как и у Zhu et al. . (2003) (θ = 0.00086) в 66,6 т.п.н. кодирующей последовательности и связанных интронов, нетранслируемых областей и перигенной последовательности. Уровень разнообразия последовательностей культурной сои по сравнению с другими культурными видами относительно невысок. Например, в рисе Feltus et al . (2004) на основе сравнения черновых последовательностей двух подвидов риса O. sativa ssp. индика и японская .Это эквивалентно нуклеотидному разнообразию θ = 0,00181. Расчет по Каназину и др. . (2002) указали на нуклеотидное разнообразие θ = 0,0025 в 21,3 т.п.н. последовательности, проанализированной у пяти различных сортов ячменя. Точно так же нуклеотидное разнообразие, θ = 0,0023, у сорго ( Sorghum bicolor ) (Hamblin et al. , 2004) более чем в два раза больше, чем у сои. У современных инбредов кукурузы ( Z. mays L.) Wright et al. . (2005) сообщили о нуклеотидном разнообразии θ = 0.00627, что более чем в шесть раз больше, чем у сои. Об аналогичном высоком нуклеотидном разнообразии θ = 0,0077 сообщалось при сравнении двух генотипов сахарной свеклы Schneider et al. . (2001). Наряду с низким разнообразием последовательностей, неоднородность нуклеотидного разнообразия по 2,44 Мбп последовательности, проанализированной в этом исследовании, также снизила количество обнаруженных SNP-содержащих генных фрагментов по сравнению с . что можно было бы ожидать, если бы полиморфизмы были распределены равномерно по 4240 STS.Эта гетерогенность, вероятно, является продуктом избирательного охвата, который произошел во время одомашнивания сои, что привело к участкам генома культивируемой сои, в которых присутствует небольшая вариация последовательности или ее отсутствие. Hyten и др. . (2006) сообщили, что, хотя только 6,8% генов, исследованных в 26 диких соевых бобах [ G. soja (Sieb and Zucc.)], Не содержали вариантов последовательностей, 24,5% не показали изменений в наборе из 52 экзотических G. max образцы зародышевой плазмы. Это говорит о том, что почти пятая часть генома культивируемой сои является генетически инвариантной в результате выборочного обследования, связанного с одомашниванием.

    Доля инделей к общему количеству вариантов последовательности в генной и перигенной последовательности у соевых бобов (15%) весьма схожа с таковой у Arabidopsis. Шмид и др. . (2003) определили, что 14% полиморфизмов последовательностей, обнаруженных при повторном секвенировании 12 генотипов, были инделениями. В культурном ячмене сопоставимая доля несколько ниже (8%) на основании анализа полиморфизма последовательностей пяти различных сортов ячменя (Каназин и др. , 2002).Напротив, частота появления инделей в генах кукурузы и вокруг них значительно превышает то, что сообщалось на сегодняшний день для сои и других видов растений. Бхаттрамакки и др. . (2002) обнаружили 655 инделей с помощью анализа последовательности 502 генных локусов (180 618 п.н. выровненной последовательности) путем пересеквенирования восьми различных инбредов кукурузы. Это было в среднем одна индель на каждые 276 б.п. В данном исследовании одна индель обнаруживалась каждые 2905 п.н. В то время как только шесть генотипов были проанализированы в случае сои против .восемь в работе Бхаттрамакки и др. . (2002), очевидно, что частота инделя в генной последовательности сои существенно ниже, чем у кукурузы.

    Разнообразие гаплотипов:

    Среднее количество гаплотипов, присутствующих среди 6 генотипов сои в 2032 SNP-содержащих STS, составляло 2,31, что лишь немного меньше, чем 2,74 гаплотипов, обнаруженных в 96 SNP-содержащих генных фрагментах, проанализированных в 25 различных генотипах. генотипы сои по Zhu et al . (2003). Таким образом, с использованием 6 генотипов, идентифицированных Zhu et al .(2003) как подмножество, которое идентифицировало бы 93% общих SNP (частота ≥0,10), по-видимому, была успешной. Ограниченное разнообразие гаплотипов сои сопоставимо с таковым у других видов сельскохозяйственных культур. Например, Килиан и др. . (2006) определили гаплотипическое разнообразие среди 20 одомашненных линий ячменя в 7 генах ячменя и сообщили в среднем о 2,4 гаплотипах на локус. В другом отчете по ячменю было обнаружено в среднем 2,81 гаплотипа на STS посредством анализа 309 STS со средней длиной 466 п.н. у 7 культивируемых и 1 дикого ячменя ( Hordeum vulgare ssp. spontaneum ) генотип (Rostoks et al .2005). Чинг и др. . (2002) проанализировали фрагменты 18 генов у 36 инбредов кукурузы и обнаружили от 2 до 8 гаплотипов со средним значением всего 4,4 гаплотипа на ген. У культивируемой сои относительно ограниченное разнообразие гаплотипов, как предполагается, в основном является результатом ограниченного разнообразия дикого предка, усугубляемого дальнейшей утратой разнообразия в результате одомашнивания (Hyten et al .2006).

    Более полная генетическая карта сои:

    Предыдущая версия генетической карты сои (Song et al .2004) включали 1015 маркеров на основе ПЦР (SSR). Добавление 1141 маркера на основе последовательности гена дает первую карту транскриптов сои (файл дополнительных данных 1 на http://www.genetics.org/supplemental/). Разнообразие функций генов, связанных с этими транскриптами, дает исследователям возможность идентифицировать потенциальные гены-кандидаты для> 1150 QTL, о которых сообщалось до сих пор для сои, по ряду признаков, связанных с биотическими и абиотическими стрессами, ростом и морфологией растений, а также качеством семян (SoyBase: http: // soybase.agron.iastate.edu/). Эта исходная карта транскриптов и дополнительные маркеры, которые она содержит, должны улучшить как прикладные, так и базовые исследования генетики и геномики сои, включая обнаружение QTL, селекцию с помощью маркеров, клонирование на основе карты и привязку физического к генетической карте. Удвоение количества генетически картированных маркеров на основе последовательностей — это шаг вперед в создании ресурсов, которые потребуются для сборки полногеномной последовательности соевых бобов (Joint Genome Institute 2006).

    Распределение генов и маркеров SSR и RFLP:

    Кластеризация картированных генных локусов, о которых здесь сообщается, не была неожиданной. Мадж и др. . (2004) гибридизировали зонды RFLP, полученные в результате расщепления геномной ДНК Pst I, с матричными клонами ВАС. Многочисленные случаи гибридизации негомологичных зондов с обычными клонами ВАС показали, что полученные из генов RFLP были сгруппированы в геноме. Эти авторы пришли к выводу, что большинство генов сои сгруппированы в ~ 275 Мбит / с генома, что составляет ~ 25% генома размером 1100 Мбит / с.Наш анализ четко подтвердил кластеризацию генов на генетической карте, хотя было бы трудно сделать выводы о пропорции генома, богатого генами по сравнению с . ген бедный. Такой анализ должен проводиться по мере того, как физическая карта сои будет прогрессировать и последовательность генома станет доступной.

    Анализ данных последовательностей ДНК A. thaliana , риса, сои, кукурузы и пшеницы ( Triticum aestivium ) (Morgante et al. .2002) пришел к выводу, что частота SSR была значительно выше в транскрибируемых областях. и что микросателлиты (SSR) связаны с низкокопийными частями геномов растений, а не с участками повторяющейся ДНК.Напротив, эмпирические данные по сои показали, что концевые последовательности клонов ВАС, идентифицированные с помощью зондов RFLP, полученных из Pst I. маркеры (Марек и др. , 2001). Эти данные свидетельствуют о том, что по отношению к SSR, RFLP, как правило, более тесно связаны с богатыми генами регионами. Таким образом, 138 пробелов> 5 см между соседними маркерами на основе ПЦР (SSR) в предыдущей генетической карте сои на основе SSR (Song et al .2004) могут включать регионы, представляющие интерес для геномистов и селекционеров сои, поскольку эти пробелы часто содержат один или несколько локусов RFLP. На основе карты транскриптов, разработанной путем позиционирования 1141 гена на ранее существовавшей карте SSR / RFLP, локусы SSR, по-видимому, по крайней мере так же тесно связаны с генной последовательностью, как локусы RFLP (рис. 4). Таким образом, независимо от взаимосвязи между генной последовательностью и маркерами SSR и RFLP, SNP на основе генов, картированные в этом исследовании, эффективно заполнили многие из 5- и 10-сМ пробелов на предыдущей карте по крайней мере одним новым маркером на основе ПЦР.

    Доступ к технологии маркеров SNP:

    Используемое здесь обнаружение SNP проводилось с использованием двух платформ обнаружения SNP. Технология Sequenom MassARRAY хорошо зарекомендовала себя, и вся необходимая информация, включая переработанные праймеры для ПЦР для амплификации фрагмента, содержащего SNP, а также праймер для удлинения одного основания для обнаружения одного SNP, картированного на STS, доступна по адресу http: // bfgl. anri.barc.usda.gov/soybean/ (файл: Sequenom Information.xls). На основе этой информации могут быть разработаны мультиплексные анализы с использованием технологии MassARRAY, а услуги генотипирования доступны на коммерческой основе.В анализах, проводимых на проточном цитометре Luminex, также использовалось одноосновное удлинение. Одноосновные удлинительные праймеры для обнаружения одного SNP в каждом из 502 STS доступны по адресу http://bfgl.anri.barc.usda.gov/soybean/ (файл: Luminex Information.xls). Проточный цитометр Luminex продемонстрировал свою гибкость в том, что, помимо анализов удлинения на основе одного основания, на этой платформе можно использовать анализы на основе гибридизации, а также анализы лигирования олигонуклеотидов (OLA). Ли и др. сообщили о сравнении анализов удлинения на одно основание, гибридизации и OLA для обнаружения SNP в сое.(2004). Сообщалось, что анализы удлинения с одним основанием были довольно надежными, но после оптимизации система гибридизации на самом деле стала более быстрой и менее дорогостоящей для каждой точки данных, что сделало последний анализ более подходящим для высокопроизводительного отбора с помощью маркеров. 1141 фрагмент гена, картированный в этом исследовании, содержал в общей сложности 2928 SNP. Данные, относящиеся к аллелю в каждом локусе SNP в каждом STS, позволят пользователю разрабатывать анализы на основе постоянно растущего числа систем анализа обнаружения SNP.Они были рассмотрены Syvänen (2001, 2005) и Ng and Liu (2006). Существующие системы плюс обещание новых систем предполагают постоянно улучшающуюся пропускную способность обнаружения SNP в сочетании со снижением затрат на точку данных. Хотя новейшие технологии, описанные Syvänen (2005), могут быть недоступны сразу для генетиков сои, в настоящее время доступен ряд систем в дополнение к технологии Sequenom MassARRAY и проточному цитометру Luminex. Недорогая и широко используемая альтернатива для обнаружения ограниченного числа SNP основана на изменении сайта эндонуклеазы рестрикции присутствием SNP.Эти так называемые маркеры расщепленных амплифицированных полиморфных последовательностей (CAPS) (Glazebrook et al , 1998) успешно используются в течение довольно долгого времени. Таким образом, если QTL обнаружен в определенной области генома, SNP в этой области могут быть идентифицированы, проанализированы и преобразованы в маркеры CAPS и использованы в селекции с помощью маркеров. CAPS-анализы можно проводить на агарозных гелях, которые доступны во многих селекционных лабораториях. Действительно, таким способом был получен маркер CAPS, связанный с важным геном ms2 мужской стерильности в нижней части группы сцепления O (J.М. Чаки и Дж. Э. Шпехт, неопубликованные результаты). По мере размещения дополнительных маркеров SNP на карте будет доступно больше потенциальных SNP в любом заданном регионе генома, из которого можно будет разработать тесты для селекции с помощью маркеров.

    Благодарности

    Мы благодарим Тину Сфон, Тэда Сонстегарда, Лабораторию функциональной геномики крупного рогатого скота, Институт животных и природных ресурсов и Центр секвенирования ДНК Белтсвилльского центра сельскохозяйственных исследований Восточного центра за помощь в получении данных о последовательностях.Работа поддержана грантами 3212, 4212 и 5212 от United Soybean Board. Мы очень признательны за поддержку Объединенного совета по соевым бобам. Авторы также благодарят Monsanto за финансирование генотипирования SNP, которое было проведено в Genaissance Pharmaceuticals Мин Сеоб Ли (Секвеном, Сан-Диего).

    Сноски

    • ↵1 Текущий адрес: NICEM, CALS, Сеульский национальный университет, Сан 56-1, Силлим-9-донг, Кванак-гу, Сеул, 151-921, Южная Корея.

    • Коммуникационный редактор: Дж.A. Birchler

    • Получено 12 января 2007 г.
    • Принято 16 февраля 2007 г.
    • Авторские права © 2007 Американского генетического общества

    Ссылки

    1. Bhattramakki, D. M. Dolan, M. Hanafey, R. Wineland, D. Vaske et al. ., 2002 Инсерционно-делеционный полиморфизм в 3′-регионах генов кукурузы встречается часто и может использоваться в качестве высокоинформативных генетических маркеров. Завод Мол. Биол. 48 : 539–547.

    2. Blanc, G., and K. H. Wolfe, 2004 Широко распространенная палеополиплоидия у модельных видов растений, выведенная из возрастного распределения повторяющихся генов. Растительная клетка 16 : 1667–1678.

    3. Чен, Дж., М. А. Ианноне, М. С. Ли, Дж. Д. Тейлор, П. Риверс и др. ., 2000 Анализ на основе микросфер для анализа мультиплексированного однонуклеотидного полиморфизма с использованием удлинения одной основной цепи. Genome Res. 10 : 549–557.

    4. Чинг, А., К. С. Колдуэлл, М. Юнг, М. Долан, О. С. Смит и др. ., 2002 Частота SNP, структура гаплотипа и неравновесие сцепления в элитных инбредных линиях кукурузы. BMC Genet. 3 : 19.

    5. Concibido, V. C., R. L. Denny, D. A. Lange, J. H. Orf и N. D. Young, 1996 ПДРФ картирование и селекция с помощью маркеров устойчивости цист нематод сои в PI 209332. Crop Sci. 36 : 1643–1650.

    6. Cregan, P.Б., Т. Джарвик, А. Л. Буш, Р. С. Шумейкер, К. Г. Ларк и др. ., 1999 Интегрированная карта генетического сцепления генома сои. Crop Sci. 39 : 1464–1490.

    7. Ewing, B., and P. Green, 1998 Базовый вызов трассировок автоматического секвенсора с использованием phred. II. Вероятности ошибок. Genome Res. 8 : 186–194.

    8. Feltus, F. A., J. Wan, S. R. Schulze, J. C. Estill, N. Jiang et al. ., 2004 SNP-ресурс для генетики и селекции риса, основанный на сопоставлении геномов подвидов indica и japonica.Genome Res. 14 : 1812–1819.

    9. Гиббонс, Дж. Д., 1976 Непараметрические методы количественного анализа . Холт, Райнхарт и Уинстон, Остин, Техас.

    10. Glazebrook, J., E. Drenkard, D. Preuss и F. M. Ausubel, 1998 Использование расщепленных амплифицированных полиморфных последовательностей (CAPS) в качестве генетических маркеров в Arabidopsis thaliana. Методы Мол. Биол. 82 : 173–182.

    11. Гордон, Д., C. Abajian и P. Green, 1998 Consed: графический инструмент для завершения последовательности. Genome Res. 8 : 195–202.

    12. Гриффин, Т. Дж., Дж. Г. Холл, Дж. Р. Прудент и Л. М. Смит, 1999 Прямой генетический анализ с помощью матричной лазерной десорбционной / ионизационной масс-спектрометрии. Proc. Natl. Акад. Sci. США 96 : 6301–6306.

    13. Галушка, М. К., Дж. Б. Фан, К. Бентли, Л. Хси, Н. Шен и др. ., 1999 Паттерны однонуклеотидных полиморфизмов в генах-кандидатах на гомеостаз кровяного давления.Nat. Genet. 22 : 239–247.

    14. Hamblin, MT, SE Mitchell, GM White, J. Gallego, R. Kukatla et al ., 2004 Сравнительная популяционная генетика паникоидных трав: полиморфизм последовательностей, неравновесие по сцеплению и отбор в разнообразной выборке сорго двухцветное. Генетика 167 : 471–483.

    15. Hymowitz, T., 2004 Виды и цитогенетика, стр. 97–136 в Soybeans: Improvement, Production, and Use , ed by H.R. Boerma и J. E. Specht. Американское агрономическое общество, Американское общество растениеводства, Американское почвенное общество, Мэдисон, Висконсин.

    16. Hyten, D. L., Q. Song, Y. Zhu, I. Y. Choi, R. L. Nelson et al. ., 2006 Влияние генетических узких мест на разнообразие генома сои. Proc. Natl. Акад. Sci. USA 103 : 16666–16671.

    17. Джандер, Г., С. Р. Норрис, С. Д. Рунсли, Д. Ф. Буш, И. М. Левин и др. ., 2002 Клонирование арабидопсиса на основе карт в постгеномную эру. Plant Physiol. 129 : 440–450.

    18. Каназин, В., Х. Тальберт, Д. См., П. ДеКэмп, Э. Нево и др. ., 2002 Открытие и анализ однонуклеотидных полиморфизмов ячменя (Hordeum vulgare ). Завод Мол. Биол. 48 : 529–537.

    19. Кейм П., Т. К. Олсон и Р. К. Шумейкер, 1988 г. Быстрый протокол выделения ДНК соевых бобов.Soybean Genet. Newsl. 15 : 150–152.

    20. Килиан, Б., Х. Озкан, Дж. Коль, А. фон Хезелер, Ф. Барале и др. ., 2006 Структура гаплотипов семи генов ячменя: актуальность для узких мест генофонда, филогения тип колоса и место одомашнивания ячменя. Мол. Genet. Геномика 276 : 230–241.

    21. Ли, С. Х., Д. Р. Уокер, П. Б. Креган и Х. Р. Бурма, 2004 г. Сравнение четырех анализов обнаружения SNP проточной цитометрией и их использование для улучшения растений.Теор. Прил. Genet. 110 : 167–174.

    22. Марек, Л. Ф., Дж. Мадж, Л. Дарниэль, Д. Грант, Н. Хансон и др. ., 2001 Геномный обзор сои: последовательности BAC-конца рядом с маркерами RFLP и SSR. Геном 44 : 572–581.

    23. Март, Г. Т., И. Корф, М. Д. Янделл, Р. Т. Йе, З. Гу и др. ., 1999 Общий подход к открытию однонуклеотидного полиморфизма. Nat. Genet. 23 : 452–456.

    24. Matukumalli, L., J. Grefenstette, D. Hyten, I.-Y. Чой, П. Креган и др. ., 2006a Применение машинного обучения в обнаружении SNP. BMC Bioinformtics 7 : 4.

    25. Matukumalli, L., J. Grefenstette, D. Hyten, I.-Y. Чой, П. Креган и др. ., 2006b SNP-PHAGE — конвейер обнаружения SNP с высокой пропускной способностью. BMC Bioinformatics 7 : 468.

    26. Morgante, M., M. Hanafey и W. Powell, 2002 Микросателлиты преимущественно связаны с неповторяющейся ДНК в геномах растений. Nat. Genet. 30 : 194–200.

    27. Mudge, J., Y. Huihuang, R. L. Denny, D. K. Howe, D. Danesh et al. ., 2004 Контиги искусственных хромосом бактерий сои, закрепленные с помощью RFLP: понимание дупликации генома и кластеризации генов. Геном 47 : 361–372.

    28. Насу, С., Дж. Сузуки, Р.Охта, К. Хасегава, Р. Юи и др. ., 2002 Поиск и анализ однонуклеотидных полиморфизмов (SNP) в рисе (Oryza sativa, Oryza rufipogon) и установление маркеров SNP. ДНК Res. 9 : 163–171.

    29. Нельсон, Р. Т., Д. Грант и Р. С. Шумейкер, 2005 ESTminer: набор программ для идентификации генов и аллелей. Биоинформатика 21 : 691–693.

    30. Ng, J. K., and W. T. Liu, 2006 Миниатюрные платформы для обнаружения однонуклеотидных полиморфизмов.Анальный. Биоанал. Chem. 386 : 427–434.

    31. Nordborg, M., T. T. Hu, Y. Ishino, J. Jhaveri, C. Toomajian et al. ., 2005 Модель полиморфизма Arabidopsis thaliana. PLoS Biol. 3 : e196.

    32. Rostoks, N., S. Mudie, L. Cardle, J. Russell, L. Ramsay et al. ., 2005 Полногеномное открытие SNP и анализ сцепления в ячмене на основе генов, чувствительных к абиотическим стресс. Мол. Genet.Геномика 274 : 515–527.

    33. Сачиданандам, Р., Д. Вайсман, С. С. Шмидт, Дж. М. Какол, Л. Д. Стейн и др. ., 2001 Карта вариации последовательности генома человека, содержащая 1,42 миллиона однонуклеотидных полиморфизмов. Nature 409 : 928–933.

    34. Шлютер, Дж. А., П. Диксон, К. Грейнджер, Д. Грант, Л. Кларк и др. ., 2004 Разработка баз данных EST для определения эволюционных событий основных видов сельскохозяйственных культур.Геном 47 : 868–876.

    35. Schmid, KJ, TR Sorensen, R. Stracke, O. Torjek, T. Altmann et al. ., 2003 Крупномасштабная идентификация и анализ однонуклеотидных полиморфизмов по всему геному для картирования у Arabidopsis thaliana. Genome Res. 13 : 1250–1257.

    36. Schmid, KJ, S. Ramos-Onsins, H. Ringys-Beckstein, B. Weisshaar и T. Mitchell-Olds, 2005 г. Исследование мультилокусных последовательностей Arabidopsis thaliana показывает отклонение от нейтрального модель полиморфизма последовательности ДНК.Генетика 169 : 1601–1615.

    37. Schneider, K., B. Weisshaar, D. C. Borchardt и F. Salamini, 2001 Частота SNP и структура аллельных гаплотипов генов, экспрессируемых Beta vulgaris. Мол. Порода. 8 : 63–74.

    38. Shoemaker, R.C., K. Polzin, J. Labate, J. Specht, E.C.Brummer et al. ., 1996 Дупликация генома сои (Glycine subgenus soja). Генетика 144 : 329–338.

    39. Song, Q.Дж., Л. Ф. Марек, Р. С. Шумейкер, К. Г. Ларк, В. К. Консибидо, и др. ., 2004 г. Новая интегрированная карта генетического сцепления сои. Теор. Прил. Genet. 109 : 122–128.

    40. Стейси, Г., Л. Водкин, У. А. Паррот и Р. С. Шумейкер, Отчет о семинаре, спонсируемом Национальным научным фондом 2004 года. Проект плана геномики сои. Plant Physiol. 135 : 59–70.

    41. Стэплтон, М., Дж. Карлсон, П. Брокштейн, К.Yu, M. Champe et al. ., 2002 Ресурс полноразмерной кДНК дрозофилы. Genome Biol. 3 : ИССЛЕДОВАНИЕ0080.

    42. Syvänen, A.C, 2001 Доступ к генетическим вариациям: генотипирование однонуклеотидных полиморфизмов. Nat. Преподобный Жене. 2 : 930–942.

    43. Syvänen, A.C, 2005 К полногеномному генотипированию SNP. Nat. Genet. 37 (Дополнение): S5 – S10.

    44. Tenaillon, M. I., M. C. Sawkins, A.Д. Лонг, Р. Л. Гаут, Дж. Ф. Добли и др. ., 2001 Паттерны полиморфизма последовательности ДНК вдоль хромосомы 1 кукурузы (Zea mays ssp. Mays L.). Proc. Natl. Акад. Sci. USA 98 : 9161–9166.

    45. Тускан, Г. А., С. Дифазио, С. Янссон, Дж. Больманн, И. Григорьев и др. ., 2006 Геном тополя черного, Populus trichocarpa (Torr. & Gray). Наука 313 : 1596–1604.

    46. Ван Оойен, Дж.W., and R.E. Voorrips, 2001 Программа JoinMap 3.0 для расчета карт генетического сцепления . Plant Research International, Вагенинген, Нидерланды.

    47. Vodkin, LO, A. Khanna, R. Shealy, SJ Clough, DO Gonzalez et al. ., 2004 Микромассивы для глобальной экспрессии, сконструированные с низкой избыточностью набора из 27500 секвенированных кДНК, представляющих массив онтогенетических Стадии и физиологические условия растения сои. BMC Genomics 5 : 73.

    48. Ван Д., Дж. Ши, С. Р. Карлсон, П. Б. Креган, Р. В. Уорд и др. ., 2003 Недорогая высокопроизводительная система электрофореза в полиакриламидном геле для генотипирования с помощью маркеров микросателлитной ДНК.

      Добавить комментарий

      Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Ген Mttp Микросомальный белок переноса триглицеридов
    Вариант сплайсинга Mttp_EU553486 вариант транскрипта

    3-триглицеридный вариант Mttp_EU553486 , определяемый микросомным переносом

    Использование идентификатора доступа к последовательности обеспечивает однозначное и точное определение варианта склейки.

    2.4.2 Прочитанные стенограммы

    Сквозной транскрипт — это мультиэкзонный транскрипт, который разделяет один или несколько экзонов с неперекрывающимися более короткими транскриптами, которые, как считается, представляют продукты разных локусов. Обычно это легко распознается как отдельный образец, не путать с простым альтернативным сплайсингом для локуса.

    Гены считываемых транскриптов должны иметь уникальный символ и имя. Пример показан на диаграмме ниже.

    2.4.3 Гены противоположной цепи

    Транскрипты из противоположной цепи, которые перекрывают другой ген, или транскрипт, который происходит преимущественно из интронов другого гена, или транскрипт, который использует альтернативную рамку считывания для другого гена (и не использует существующую рамку в значительной степени), получить другое имя.

    Другим генам на противоположной цепи следует присвоить символ известного гена с суффиксом «os» для противоположной цепи.

    Пример:

    Zbtb8os цинковый палец и домен BTB, содержащий 8 противоположных цепей

    2.4.4 Гены с гомологами у других видов

    Для облегчения межвидового сравнения генетической и другой информации гену, который можно идентифицировать как гомолог / ортолог уже названного человеческого гена, следует, по возможности, дать то же имя и символ, что и человеческий ген.
    Имя или символ гена не должны включать в себя название «мышь» или какое-либо сокращение, такое как буква «М» для мыши или название «крыса», или любое сокращение, такое как буква «R» для крысы.

    2.5 Названия и символы фенотипов

    Гены, названные по фенотипам, должны стремиться кратко и точно передать фенотип несколькими словами.Принято считать, что название не может охватывать все аспекты фенотипа; что необходимо, так это емкое, запоминающееся и главное уникальное имя. Имейте в виду, что идентификация варианта или мутантного фенотипа — это распознавание аллельной формы еще не идентифицированного гена, которая может уже иметь или будет иметь имя.

    2.5.1 Летальные фенотипы

    Гены, идентифицированные исключительно по рецессивному летальному фенотипу без гетерозиготного эффекта, названы по хромосомному назначению, серийному номеру и названию лаборатории происхождения (из кода лаборатории).

    Примеры:

    l4Jus24 летальный, Chr 4, Justice 24
    l1Rk8 летальный, Chr 1, Родерик 8

    2.6 Генные семьи

    Гены, которые кажутся членами семьи, следует называть членами семьи. Свидетельства о семействе генов бывают разных форм, но в основном основаны на сравнении последовательностей.

    2.6.1 Семьи, идентифицированные гибридизацией

    Исторически многие семейства генов были идентифицированы как фрагменты, обнаруженные путем гибридизации с одним и тем же зондом, но которые картируются в разные локусы.Эти члены семьи могут быть
    функциональные гены или псевдогены. Локусы можно назвать «родственной последовательностью» гена-основателя с порядковым номером (символ -rs1, -rs2, и так далее).

    Пример:

    мышиные последовательности, относящиеся к орнитиндекарбоксилазе от 1 до 21. Odc-rs1 от до Odc-rs21

    Если основатель или функциональный ген не могут быть идентифицированы, первоначально все фрагменты называются «родственной последовательностью», пока она не будет идентифицирована; затем этот конкретный «-rs» удаляется без изменения нумерации.Если есть доказательства того, что какие-либо локусы являются псевдогенами, они должны быть названы как таковые и иметь порядковые номера, как в Разделе 2.6.2.

    После того, как доказательства последовательности накоплены на функциональных членах семейства (которые могут или не могли быть ранее идентифицированы как члены), систематическая схема именования
    следует применять к семье, как в разделе 2.6.2.

    2.6.2 Семейства, идентифицированные сравнением последовательностей

    Секвенирование позволяет идентифицировать гены, которые явно являются членами семейства (паралоги).По возможности члены семьи должны быть названы и обозначены одинаковыми символами.
    стержень, за которым следует серийный номер. Одни и те же члены семейства у разных видов млекопитающих (ортологов) должны, по возможности, иметь одно и то же имя и символ.
    Известным псевдогенам следует присвоить порядковый номер. Было показано, что функциональная активность гена, имеющего обозначение псевдогена, может проявляться у разных линий мышей и крыс.
    Следовательно, псевдогенам обычно присваивается следующий номер или буква в соответствующей серии символов семейства генов.Обратите внимание, что нумерация псевдогенов среди видов является независимой, и никакие отношения между псевдогенами мыши, крысы или человека не должны подразумеваться на основе их серийной нумерации.
    Гены, которые, как известно, являются псевдогенами в любой линии мышей, получают отметку о биотипе специфичного для штамма маркера, которая включает специфичную для штамма функциональную информацию.

    Примеры:

    15, названных

    .

    Многие семейства генов были признаны и получили систематическую номенклатуру.Информацию об этих семьях можно найти на семейных веб-сайтах, некоторые из которых связаны с MGD и RGD. Имена и символы новых членов этих семей должны соответствовать правилам конкретной семьи и в идеале присваиваться после консультации с куратором этой семьи.
    Номенклатурные схемы и курирование новых семей выигрывают от изучения существующих моделей.

    2.7 ESTs

    Метки экспрессируемой последовательности

    (EST) отличаются от других экспрессируемых последовательностей тем, что они являются короткими однопроходными последовательностями, которые часто удобны для амплификации ПЦР из геномной ДНК.EST, которые явно происходят от известного гена, следует рассматривать просто как тест (маркер) для этого известного гена. Когда анонимные EST наносятся на генетические или физические карты, их обозначения должны быть
    обозначены их регистрационными номерами в базе данных последовательностей.

    2.8 Анонимные сегменты ДНК

    Только анонимные сегменты ДНК, которые нанесены на карту, должны иметь систематические имена и символы.

    2.8.1 Картированные сегменты ДНК

    Анонимные сегменты ДНК названы и обозначены символами в соответствии с лабораторией, идентифицирующей или отображающей сегмент как «сегмент ДНК, хромосома N, лабораторный код», и серийный номер, где N — хромосомное назначение (1-19, X, Y у мыши и 1-20, X, Y у крысы) и обозначается как DNLabcode #.

    Примеры:

    У крыс кальмодулин псевдогены 1 и 2, Calm-ps1 и Calm-ps2
    У мышей, фосфоглицераткиназа 1a — 1d, Pgk1a to Pg Ces2a, Ces2b, Ces2c, Ces2d1, Ces2e, Ces2f, Ces2g, Ces2h
    Члены семейства гена карбоксилэстеразы 2, где Ces2d1 появляется как уникальная сущность в серии 41 915 членов семейства

    41

    То же самое соглашение применяется к сегментам ДНК, которые являются вариантными локусами в пределах известных генов.

    Примеры:

    D8Mit17 Сегмент ДНК, Chr 8, Массачусетский технологический институт 17
    D1Arb27 Сегмент ДНК, Chr 1, отделение артрита и ревматизма, NIAMS

    D4Mit17 Сегмент ДНК, Chr 4, Массачусетский технологический институт 17 (простой полиморфизм длины последовательности внутри мыши, ген Orm1 )
    D20Wox Trust3 сегмент ДНК, сегмент ДНК Wellcome Oxford 3 (простой полиморфизм длины последовательности внутри крысиного гена Tnf )

    Сегментам ДНК мыши или крысы, обнаруженным перекрестной гибридизацией с человеческими сегментами, дается человеческое имя со вставкой «хромосома N, перекрестная гибридизация с сегментом ДНК человека».
    между сегментом ДНК и кодом сегмента человека (см. символы).То же самое относится к сегментам ДНК крысы, обнаруженным перекрестной гибридизацией с сегментами мыши (или наоборот).

    Примеры:

    D16h31S13 Мышь
    Сегмент ДНК на Chr 16, который перекрестно гибридизуется с сегментом ДНК D21S13 из человеческого Chr 21
    D1M7Mit236 Крыса
    Сегмент ДНК на Chr 1, который перекрестно гибридизуется с сегментом ДНК D7Mit236 от Chr 7 мыши

    2.8.2 STS, используемые в физическом отображении

    Когда физические карты собраны (например, контиги YAC или BAC), многие маркеры могут быть размещены на карте в виде сайтов с тегами последовательностей (STS).
    Это могут быть концевые фрагменты клона, продукты ПЦР между повторами последовательностей или случайные последовательности из клонов.
    Эти маркеры служат для проверки контигов и появляются на картах, но их дальнейшее использование может быть ограничено.
    Нет необходимости давать им имена или символы, кроме тех, которые присвоены лабораторией, которая их произвела и использовала.Если STS используются более широко, им следует присвоить имена анонимных сегментов ДНК («D-номера»).

    2.9 Локусы генных ловушек

    Эксперименты с генной ловушкой в ​​эмбриональных стволовых (ES) клетках производят клеточные линии, в которых интеграция с предполагаемым геном выбирается на основании его экспрессии в ES-клетках.
    Захваченный ген обычно (хотя и не обязательно) мутируется в результате интеграции. Сайт интеграции можно охарактеризовать несколькими способами,
    включая клонирование или расширение продуктов кДНК.Локусы интеграции серии линий генных ловушек, однажды охарактеризованных как потенциально уникальные, могут быть названы и обозначены как члены серии, используя префикс Gt (для гена
    trap), за которым следует обозначение вектора в скобках, серийный номер, присвоенный лабораторией, характеризующей локус, и лабораторный код ILAR.
    Например, 26-й ген, «пойманный» вектором ROSA в лаборатории Филиппа Сориано (Сор), обозначается как:

    За исключением вышеуказанного случая, обозначение генной ловушки становится аллелем гена, в который он был вставлен, после того, как этот ген идентифицирован.Например, известно, что Gt (ST629) Byg нарушает работу нетрина 1 ( Ntn1 ).
    ген; таким образом, полное обозначение аллеля для этой мутации-ловушки гена — Ntn1 Gt (ST629) Byg . См. Также примеры мутаций генных ловушек в Разделе 3.5.2.

    2.10 Локусы количественных признаков, гены устойчивости и иммунитет
    Ответные гены

    Различия между инбредными штаммами и фенотипом потомков от скрещиваний между штаммами свидетельствуют о существовании генов, влияющих на устойчивость к болезням, иммунный ответ и многие другие количественные признаки (локусы количественных признаков, QTL).Доказательства QTL обычно получают путем обширного генетического скрещивания и анализа, который может выявить многие генетические элементы, вносящие вклад в фенотипический признак. Как правило, количество и эффекты QTL могут быть выведены только после экспериментов по их картированию. QTL не следует называть до тех пор, пока не будут выполнены такие эксперименты по картированию.

    2.10.1 Названия и символы QTL

    Имена и символы для QTL должны быть краткими и описательными и отражать измеряемый признак или фенотип.Те QTL, влияющие на один и тот же признак, должны иметь одинаковую основу и иметь порядковые номера. Серия является отдельной для мыши и крысы, и не должно быть гомологии.
    подразумевается серийными номерами.

    Некоторые исторически названные QTL несут название болезни, с которой они связаны; эти названия сохраняются, но вновь идентифицированный QTL должен быть назван по измеряемому признаку и
    не болезнь. Суффикс «q» может использоваться необязательно как последняя буква, предшествующая порядковому номеру в символах QTL.

    При наименовании и символизации QTL следуют тем же соглашениям, что и для наименования и символизации генов (раздел 2.3). Специально для QTL его имя должно включать:

    • корневое имя, описывающее измеряемый признак
    • обозначение QTL (рекомендуется)
    • серийный номер

    Примеры:

    Чтобы получить следующий доступный серийный номер для нового QTL с уже установленным корневым именем, e.g ., следующий в серии «QTL веса печени» у мыши ( Lwq # ) или
    Затем в серии «QTL артериального давления» для крысы ( Bp # ) пользователи должны представить свой QTL в форме «предложения нового символа локуса» в MGD (для мыши) или RGD (для крысы). Обратите внимание, что исследования содержимого базы данных для QTL недостаточно, поскольку лаборатория может иметь обозначение QTL.
    зарезервированные и частные, ожидающие публикации.

    2.10.2 Определение уникальности в QTL

    Конкретные обстоятельства для наименования независимого QTL включают:

    • Независимые эксперименты изучают один и тот же признак и сопоставляют этот признак с одной и той же хромосомной областью

      Поскольку QTL обнаруживаются в контексте конкретных комбинаций штаммов при конкретных скрещиваниях и, как правило, в разных лабораториях с использованием разных анализов, каждому экспериментально обнаруживающему QTL будет присвоен уникальный символ / имя, даже если измеренный признак и определенная область
      внешне такой же, как у существующего QTL.

      Пример:
      У мыши был идентифицирован Obq1 (QTL 1 ожирения) и картирован на хромосоме 7 в помесе штаммов 129 / Sv и EL / Suz.
      Другой QTL ожирения также был сопоставлен с хромосомой 7, но поскольку он включал разные штаммы (NZO и SM), ему было присвоено другое обозначение QTL, Obq15 .

    • Хромосомная область, содержащая множество измеренных «признаков»

      Если несколько признаков измеряются в одном эксперименте и сопоставлены с одной хромосомной областью, могут быть или не быть доказательства того, что задействованы разные QTL.Если черты физиологически
      связанных, имя QTL должно быть достаточно широким, чтобы представлять все измеренные признаки, или имя должно отражать признак, показывающий наивысший показатель LOD / p-значение. И наоборот, если есть четкие доказательства того, что признаки независимы, каждый признак будет составлять уникальный QTL.

      Примеры :

      У мышей, Nidd1 (инсулиннезависимый сахарный диабет 1) был связан с соответствующими измерениями инсулина в плазме, глюкозы в крови без голодания и массы тела и получил одно обозначение QTL.

      У крыс, Uae5 (QTL 5 экскреции альбумина с мочой) и Cm16 (QTL 16 сердечной массы) являются QTL, полученными из одного и того же эксперимента, которые отображают перекрывающиеся области хромосомы 1. Поскольку измеренные признаки независимы, разные обозначения QTL назначены.

    2.11 Хромосомные области

    В отдельных документах подробно описаны рекомендации по номенклатуре хромосом (для мышей Правила номенклатуры хромосомных аберраций доступны онлайн; для крыс см. Levan, et al., 1995).
    Однако определенные цитологические особенности нормальных хромосом (таких как теломеры, центромеры и ядрышковые организаторы) и аномальных хромосом (например, области с однородным окрашиванием и конечные точки делеций, инверсий и транслокаций) являются генетическими локусами, которым даны имена и символы. .
    «Кластер / область» представляет собой тип маркера, который включает кластеры и области, такие как гистон, гомеобокс, обонятельный рецептор и другие кластеры; и цитохром P450, гистосовместимость 2, опухолевый супрессор и другие области.

    2.11.1 Теломеры

    Функциональный теломер следует обозначать символом Tel . Сегмент ДНК, который включает последовательность теломерных повторов (TTAGGG) n и который отображается на теломерное местоположение, является
    символизируется в четырех частях:

    • Тел. (для теломер)
    • Номер хромосомы
    • п или q (для короткого или длинного плеча соответственно)
    • Серийный номер, если теломере назначено более одного сегмента

    Например, Tel4q1 последовательность теломерного повтора, Chr4, q рука 1

    2.11.2 Центромеры и перицентрический гетерохроматин

    Функциональную центромеру следует обозначать символом Cen . До тех пор, пока не будет определена молекулярная природа функциональной центромеры млекопитающих, сегментам ДНК, которые отображаются на центромеру, должны быть даны символы анонимных сегментов ДНК, как в Разделе 2.8.1.

    Цитологически видимый перицентрический гетерохроматин обозначается символом Hc # , где # — хромосома, на которой он расположен.

    • Например, Hc14 является перицентрическим гетерохроматином на хромосоме 14.

    Вариация размера полосы гетерохроматина может быть обозначена надстрочным индексом перед символом.

    • Например, Hc14 n — нормальный гетерохроматин; верхние индексы l и
      s будет использоваться для обозначения длинного и короткого гетерохроматина соответственно.
    2.11.3 Организаторы ядра

    Организатор ядрышка — это цитологическая структура, содержащая гены рибосомной РНК. Этим генам дается корневой символ Rnr и номер хромосомы, на которой они расположены.

    • Например, Rnr12 является локусом рибосомной РНК на хромосоме 12.

    Если разные локусы Rnr могут быть генетически идентифицированы на одной и той же хромосоме, им присваиваются порядковые номера в порядке идентификации.

    • Например, Rnr19-1, Rnr19-2 .
    2.11.4 Области с однородным окрашиванием

    Гомогенно окрашиваемые области (HSR) представляют собой усиленные внутренние субхромосомные полосы, которые
    идентифицированы цитологически по их окрашиванию по Гимзе.Сегменту ДНК, который отображается в HSR, дается стандартный символ сегмента ДНК, когда его локус находится на нормальной (неамплифицированной) хромосоме. При расширении в HSR его символ следует инструкциям по вставке, становясь, например, Is (HSR; 1) 1Lub.

    2.11.5 Хромосомные перестройки

    Символы хромосомных делеций, инверсий и транслокаций приведены в Правилах номенклатуры хромосомных аберраций. Однако конечные точки каждой из этих перестроек определяют локус.Если на хромосоме есть только один локус, символ хромосомной аномалии служит для его определения. Однако, если аномалия дает два локуса на одной хромосоме, их можно отличить буквами p и d, обозначающими проксимальный и дистальный.

    • Например, In (1) 1Rk-p, In (1) 1Rk-d — это проксимальная и дистальная конечные точки хромосомной инверсии In (1) 1Rk у мыши.

    2.12 Гены, расположенные на митохондриях

    Митохондрии несут важные гены, среди которых много генов транспортной РНК (тРНК).Гены, расположенные в митохондриях, имеют префикс mt- (строчная буква mt с дефисом). Для транспортных РНК символы состоят из трех частей: mt-, T (для тРНК) и одной строчной буквы для аминокислоты. Хромосомное обозначение митохондриальных генов — Chr MT.

    Примеры:

    у мышей Cafq1 метаболизм кофеина QTL 1
    Cafq2 метаболизм кофеина QTL 2
    915 915 915 915 915 915 915 915 915 rat Kidm1 Масса почек QTL 1
    Kidm2 Масса почек QTL 2
    Kidm3 Масса почек QTL 3
    mt-Tc тРНК, цистеин, митохондрия
    (ген тРНК
    расположенные в митохондриях)
    mt-Atp6 АТФ-синтаза 6, митохондрия
    (ген, не относящийся к тРНК, расположенный в митохондриях)

    2.13 генов домашнего хозяйства РНК, закодированных в ядре

    Существуют сотни локусов, кодирующих РНК переноса (тРНК) и рибосомные РНК (рРНК), и многие из них кодируются в ядре. Следующий метод символизирует эти ядерно-кодируемые гены РНК:

    Обозначение кодируемых ядром трансфер-РНК

    Символы кодируемых ядром трансфер-РНК состоят из четырех частей:

    n- строчная буква n с дефисом для обозначения ядерной кодировки
    T заглавная буква T для обозначения РНК переноса
    A аббревиатура для одиночной буквы аминокислота (верхний регистр)
    xxx трехбуквенный антикодон (нижний регистр)
    # серийный номер (только когда необходимо различать несколько копий определенного антикодона tRNA16 класса

    Пример:
    n-TAagc12 ядерно-кодируемая тРНК аланин 12 (антикодон AGC)

    Обозначение кодируемых ядром рибосомных РНК

    Символы кодируемых ядром рибосомных РНК состоят из четырех частей:

    915 915 915 915 субъединица

    915 915 915 915 915

    n- строчная буква n с дефисом для обозначения ядерной кодировки
    R заглавная буква R для обозначения рибосомной РНК
    субъединица # серийный номер для этой рибосомной РНК
    Пример:
    n-R5s104 rRNA 5S 104

    2.14 микроРНК и кластеры микроРНК

    МикроРНК (миРНК) — это многочисленные короткие молекулы РНК, которые являются посттранскрипционными регуляторами, которые связываются с комплементарными последовательностями на транскриптах мРНК-мишени, что обычно приводит к репрессии трансляции или деградации мишени и молчанию генов.

    Присвоение имен микроРНК
    Символы для микроРНК состоят из корневого символа Mir, за которым следует схема нумерации, отслеживаемая в базе данных miRBase (www.mirbase.org), базе данных, отслеживающей микроРНК для всех видов.( ср. Desvignes, et al., 2015)

    Например, мышь Mir143 (микроРНК 143) представлена ​​в miRBase как mmu-mir-143, где mmu означает мышь.

    Именование кластеров микроРНК
    Кластер микроРНК состоит из нескольких микроРНК, находящихся в непосредственной близости от генома. Им могут быть присвоены символы и имена, чтобы однозначно относиться ко всему кластеру.

    Для кластера микроРНК имя будет состоять из корневого символа Mirc (для кластера микроРНК), за которым следует порядковый номер (1, 2, 3…) кластера.При определении нового кластера следует проконсультироваться с MGI (для мыши) или RGD (для крысы), чтобы узнать следующий доступный номер кластера. Список микроРНК, включенных в каждый кластер, будет записан в соответствующие записи базы данных для генов, нокаутов и штаммов.

    (Обратите внимание, что это отличается от определения miRBase, которое просто относится к кластеризованным miRNA как к тем, которые меньше 10 kb от интересующей miRNA. Таким образом, в кластерах miRBase, определенных на основе одной miRNA, могут или не могут перекрываться кластеры на основе другой miRNA.

    2,15 Длинные некодирующие РНК

    Длинные некодирующие РНК (длинные нкРНК, днРНК) определяются как транскрипты длиной более 200 нуклеотидов, которые не транслируются в белок. Сохранение длинных нкРНК оценивается в индивидуальном порядке.

    • Lincmd1 для длинной межгенной небелковой кодирующей РНК мышечной дифференцировки 1
    • Xist для неактивной специфической расшифровки X

    2.16 Усилители, промоторы и регулирующие регионы

    Энхансеры, промоторы и регуляторные области могут влиять на несколько генов.Кроме того, они могут быть локализованы далеко от гена (ов), на которые они влияют. Таким образом, неправильно называть их на основании гена, регуляция которого была впервые обнаружена.

    Энхансеры, промоторы и регуляторные области должны быть обозначены как:

    Rr # нормативный регион #
    где # обозначает следующий номер в серии

    3 Имена и символы для вариантов и мутантных аллелей

    Различные аллели гена или локуса можно отличить с помощью ряда методов, включая длину фрагмента ДНК, электрофоретическую подвижность белка, сравнение последовательностей или вариант физиологического или морфологического фенотипа.

    Все мутантные аллели спонтанного или индуцированного происхождения, целевые мутации,
    генные ловушки или трансгены должны быть отправлены в MGD (мыши)
    или RGD (крыса) для идентификатора доступа аллеля или гена.

    3.1 Мутантные фенотипы

    3.1.1 Гены, известные только мутантным фенотипам

    Если ген известен только по мутантному фенотипу, гену дается имя и символ первого идентифицированного мутанта. Символы мутаций, дающих рецессивный фенотип, начинаются со строчной буквы; символы для генов доминантного или полудоминантного фенотипа начинаются с заглавной буквы.

    Примеры:

    У мыши, рецессивная пятнистость, RS ; аномальные лапы и хвост, Корма ; кружит, круг

    Дальнейшим (аллельным) мутациям в том же локусе, если они имеют тот же фенотип, дается одно и то же имя с кодом лаборатории, которому предшествует серийный номер (если более одного дополнительного аллеля из той же лаборатории). В символе надстрочным индексом добавляется код лаборатории.

    Пример:

    tp 2J второй новый аллель гена серо-коричневого цвета, идентифицированный в Лаборатории Джексона

    Если новая аллельная мутация гена, известная только по мутантному фенотипу, вызвана трансгенной вставкой, в символе этой мутации должен использоваться символ
    трансген в виде верхнего индекса (см. раздел 3.4.2 и раздел 4).

    Пример:

    awg Tg (GBtslenv) 832Pkw Эта мутация аномальной шаткой походки вызвана трансгеном мыши линии 832, полученным в лаборатории Пола Вонга. (Можно использовать сокращенную форму, awg Tg832Pkw , если сокращенное обозначение уникально.)

    Если дополнительный аллель имеет другой фенотип, ему может быть присвоено другое имя, но при отображении символа новый мутантный символ добавляется к исходному символу мутанта.Кроме того, если новая мутация описана и названа, но не будет показана как аллель существующего гена до более позднего времени, первоначальное название новой мутации может быть сохранено. Даже если фенотип явно идентичен, используется исходный символ с новым символом мутации в качестве верхнего индекса.

    Пример:

    серое пальто — это аллель рецессивной пятнистости ( rs ) у мыши и, следовательно, обозначается rs grc

    3.1.2 Фенотипы, вызванные мутациями в структурных генах

    Когда впоследствии выясняется, что спонтанный или индуцированный мутантный фенотип является мутацией в структурном гене или ген, в котором произошла мутация, клонирован, мутация становится аллелем этого гена, а символ мутантного аллеля формируется добавление исходного символа мутанта в качестве надстрочного индекса к новому символу гена. (Символ мутанта должен сохранять начальную букву в верхнем или нижнем регистре).

    • Hotfoot ( ho ) мутация рецептора глутамата мыши Grid2 , Grid2 ho
    • Доминантная мутация белого пятна ( W ) мыши Kit , Kit W

    Если исходная мутация имеет несколько аллелей, при описании этих аллелей их символы становятся частью надстрочного индекса идентифицированного структурного гена.

    • ходоуменьшитель, Grid2 ho-cpr .
    • жизнеспособных белых пятен, Kit W-v ; створка, Комплект W-sh .

    Даже если идентифицированный ген является новым и безымянным, рекомендуется, тем не менее, дать ему имя и символ, отличные от имени и символа мутанта. Это позволит легче различать мутантный и дикий тип, а также ген и фенотип.

    3.1.3 Аллели и ревертанты дикого типа

    Аллель гена дикого типа обозначен знаком + в качестве надстрочного индекса мутантного символа.

    • Аллель дикого типа мутации taupe, tp +
    • Локус дикого типа Kit (при необходимости отличить от мутаций), Kit +

    Ревертант локуса мутантного фенотипа дикого типа должен быть обозначен символом + с символом мутанта в качестве надстрочного индекса.

    • Ревертант дикого типа в мутантном локусе без шерсти + hr

    Дополнительным ревертантам присваивается лабораторный код, которому предшествует серийный номер, если в лаборатории обнаружено более одного ревертанта.Серийные номера ревертантов для мышей и крыс не зависят друг от друга.
    подразумевается гомология. Если ревертант находится в клонированном гене, то символ мутанта сохраняется как надстрочный индекс к символу гена, и добавляется +.

    • Ревертант разбавленной мутации миозина Va дикого типа; Myo5a d +
    • Второй такой ревертант, обнаруженный в лаборатории Джексона; Myo5a d + 2J

    Спроектированные реверсии фенотипических мутаций должны обозначаться символом гена и надстрочным символом мутанта, за которым следует символ + и соответствующее обозначение сконструированного аллеля.Тогда формат —

    .

    Мутация гена + tm # Labcode


    Пример:

    Crb1 rd8 + em1Mvw реверсия мутации Crb1 rd8 дикого типа в результате нацеливания, опосредованного эндонуклеазами, 1 st сообщается из лаборатории Майкла Уайлса.

    3,2 Варианты

    3.2.1 Биохимические варианты

    Электрофоретические или другие биохимические варианты аллелей известных структурных генов обычно обозначаются строчными буквами для обозначения различных аллелей, и в символе буква становится надстрочным индексом символа гена.

    Пример:

    аллели а и b глюкозофосфатизомеразы 1; Gpi1 a , Gpi1 b

    3.2.2 Варианты сегмента ДНК

    Варианты сегментов ДНК обозначаются надстрочным индексом перед символом. Этот символ обычно представляет собой аббревиатуру инбредной линии, в которой описывается вариант.
    Однако конкретный аллель может быть обнаружен в нескольких инбредных штаммах, и, кроме того, может быть трудно установить, идентичен ли аллель в одном штамме друг другу.Использование символов аллелей для сегментов ДНК в основном ограничивается описанием наследования и гаплотипов при скрещивании. Пока символы определены в описании, пользователи могут использовать все, что угодно.
    символ аллеля наилучшим образом соответствует их потребностям. В таблицах генотипов можно опустить символ гена и использовать только аббревиатуру аллеля.

    • D11Mit19 a , D11Mit19 b , D11Mit19 c — вариантные аллели D11Mit19 у мыши.
    3.2.3 Однонуклеотидные полиморфизмы (SNP)

    Полиморфизмы, определяемые SNP, могут возникать внутри или вне последовательности, кодирующей белок.

    Если SNP встречается в гене, аллель SNP может быть обозначен на основе его dbSNP_ID, за которым следует дефис и конкретный нуклеотид.

    Примеры:

    Park2 rs6200232-G Аллель SNP Park2 rs6200232 с вариантом G
    Park2 rs6200232-A 962002 rs6200232-A 962129 rs6200 2

    Если SNP встречается за пределами идентифицированного гена, локус SNP может быть обозначен с использованием dbSNP_ID в качестве символа локуса, а нуклеотидные аллельные варианты затем индексируются как аллели.Если позже обнаруживается, что ген включает этот локус SNP, применимы те же принципы, что и те, которые используются, когда символы мутантного локуса становятся аллелями известных генов.

    Примеры:

    rs6200616 T Локус SNP с вариантом T
    rs6200616 C Локус SNP с вариантом C

    13

    Примечание : Если позже будет обнаружен ген Xyz , включающий этот локус SNP, rs620061 ,
    тогда перечисленные выше аллели становятся Xyz rs620061-T
    и Xyz rs620061-C .

    3.2.4 Геномный вариант

    Определение (от Alliance of Genome Resources): последовательность ДНК, которая отличается от указанной эталонной последовательности. Разница в последовательностях возникает в одном положении или в смежных нуклеотидах.

    Примечания : В настоящее время этот термин включает следующие типы вариантов: замена, точечная мутация, вставка, делеция, вставка и делеция. Варианты генома могут относиться к ядерным или органеллярным геномам. Обозначенная эталонная последовательность представляет собой штамм C57Bl / 6J.

    Номенклатура стиля

    HGVS может использоваться для описания самого варианта, но не аллеля: https://varnomen.hgvs.org/

    3.3 Вариация локусов количественных признаков и генов ответа и устойчивости

    Вариации генов, которые не вызывают видимого фенотипа, могут быть обнаружены путем анализа физиологических или патологических параметров.
    Примеры этого типа вариации включают уровни метаболита, иммунный ответ на провокацию антигеном, вирусную резистентность или ответ на лекарства.Генетическая изменчивость может также вызывать фенотипические вариации морфологии, поведения или других наблюдаемых признаков, которые сложным образом взаимодействуют с другими генами и / или с окружающей средой.

    Эти гены можно идентифицировать только на основании аллельной изменчивости. В большинстве случаев явного дикого типа не будет; следовательно, должны быть названы все аллели.
    В большинстве случаев аллели должны быть названы в соответствии с их штаммом происхождения и обозначены добавлением аббревиатуры штамма в виде надстрочного индекса, хотя для устойчивости и чувствительности могут использоваться варианты r и s.Имейте в виду, что аллели устойчивости, происходящие от разных штаммов, могут не совпадать, и им следует давать разные названия и символы.

    После клонирования или идентификации гена, лежащего в основе количественного признака, фенотипическое название следует заменить названием идентифицированного гена.
    Названия и символы аллелей должны быть такими же, как те, которые используются для фенотипа.

    Примеры:

    Slc11a1 r семейство носителей растворенного вещества 11, аллель устойчивости к хозяину
    Slc11a1 s семейство носителей растворенного вещества 11, восприимчивость к хозяину аллель QGL488 ( был идентифицирован как Slc11a1 )
    Scc2 BALB / cHeA Восприимчивость к опухоли 2, BALB / cHeA аллель
    Scc2
    Scc2 9057 Scc2 9057 опухоль Scc2 9057 Аллель STS / A
    (для QTL Scc2 аллель STS / A имеет повышенную восприимчивость к опухоли по сравнению сBALB / cHeA)

    3.4 Вставные и индуцированные мутации

    Мутации, которые индуцируются, нацелены или отбираются в структурных генах, называются аллелями структурного гена.

    3.4.1 Мутации структурных генов

    Вариантам структурных генов, которые явно являются мутациями, независимо от того, придают ли они фенотип, дается надстрочный индекс m # Labcode, где # — серийный номер, за которым следует лабораторный код, в котором мутация была обнаружена или охарактеризована.Серийные номера назначаются мышам и крысам независимо, и один и тот же присвоенный серийный номер не подразумевает ортологии. Если известно, что мутация произошла на конкретном аллеле, это может быть
    указывается предшествующим надстрочным индексом символом аллеля и дефисом.

    • например, Mod1 a-m1Lws — это мутация мышиного аллеля Mod1 a , первая обнаруженная в лаборатории Сьюзан Льюис.

    Если показано, что мутация представляет собой делецию всего или части структурного гена, верхний индекс del может использоваться вместо m .Обратите внимание, что это следует использовать только для делеций, охватывающих один ген; Для более крупных делеций следует использовать номенклатуру хромосомных делеций.

    3.4.2 Трансгенные инсерционные мутации

    Мутации, полученные в результате случайной вставки трансгена (не путем нацеливания на гены), называются мутантным аллелем гена (которому следует дать имя и символ, если это новый ген), с надстрочным индексом, обозначающим символ трансгена ( примеры см. в разделе 3.1.1, а названия трансгенов — в разделе 4).

    3.5 Нацеленные и пойманные мутации

    3.5.1 Нокаут, нокаут, условные и другие целевые мутации

    Мутации, являющиеся результатом нацеливания гена в ES-клетки, обозначаются символом целевого гена с надстрочным индексом, состоящим из
    три части: символ tm для обозначения целевой мутации, серийный номер лаборатории происхождения и код лаборатории, в которой была произведена мутация (см. раздел 2.1).

    Пример:

    Cftr tm1Unc — первая нацеленная мутация гена трансмембранного регулятора муковисцидоза ( Cftr ), полученная в Университете Северной Каролины.

    Целевые мутации, которые приводят к устранению любой экспрессии гена (то есть к функциональному нулю), называются нокаутирующими мутациями.

    Целевые мутации, при которых чужеродный ген или сегмент гена вставляют в целевой ген, что приводит к экспрессии чужеродного гена под контролем эндогенного промотора, называются нокаутными мутациями. В этих случаях символ чужеродного (замещающего) гена используется в скобках как часть символа целевого аллеля.Однако репортерные символы не указываются в символах аллелей. Подробности, описывающие конкретные конструкции, включающие в себя, должны быть связаны в базах данных или публикациях, а не в номенклатуре.

    Примеры:

    En1 tm1 (Otx2) Wrst в этой целевой мутации, кодирующая область En1 была заменена геном Otx2 , полученным из лаборатории W. Wurst.
    Cd19 tm1 (cre) Cgn в этой целевой нокаутной мутации cre был вставлен в рамку считывания в экзоне 1.Аллель экспрессирует рекомбиназу cre специфически в клетках линии B на протяжении всего развития.
    Apoe tm1 (APOE * 2) Mae В этой целевой нокаутной мутации фрагмент ДНК, содержащий экзоны 2-4 изоформы APOE2 человека, заменял эквивалентную часть гена Apoe мыши. Человеческий белок экспрессируется этим аллелем, а эндогенный мышиный белок не обнаруживается.

    Подключаемые аллели, экспрессирующие РНКи под контролем эндогенного промотора, могут быть обозначены с использованием номенклатуры целевых мутаций или трансгенных мутаций, в зависимости от ситуации:

    Пример:

    Когда вектор нацеливания используется для генерации множественных аллелей, передающихся по зародышевой линии, например, в системе Cre-Lox, исходное включение loxP будет соответствовать обычным правилам обозначения tm.Если второй наследуемый аллель был затем сгенерирован после скрещивания с трансгенной мышью cre, он сохранил бы обозначение родителей, за которым следовали десятичная точка и серийный номер.

    Пример:

    Tfam tm1Lrsn и Tfam tm1.1Lrsn . В этом примере Tfam tm1Lrsn обозначает целевую мутацию, при которой loxP был вставлен в
    Tfam ген. Тфам тм1.1Lrsn обозначает еще один аллель , передаваемый по зародышевой линии, образовавшийся после скрещивания с трансгенной мышью cre. Примечание: соматических событий , генерируемых в потомстве от мышей, несущих Tfam tm1Lrsn , и трансгенного cre, которое вызывает нарушение Tfam в отобранных тканях, не подлежат номенклатуре.

    Другие, более сложные формы замены генов, такие как частичное «нокаутирование», «хит-и-бег», двойные замены и интеграции, опосредованные loxP, не имеют удобных сокращений и должны быть обозначены
    обычный tm # Надстрочный индекс Labcode.Подробная информация о целевом локусе должна быть приведена в связанных публикациях и записях в базе данных.

    Обратите внимание, что хотя тонкие изменения, внесенные в ген, по-видимому, поддаются простому соглашению об именах, посредством которого указываются изменения оснований или аминокислот, на самом деле они не обеспечивают уникальных имен генов, таких как такие изменения, которые могли бы быть сделаны в независимых лабораториях. , хотя и несет те же изменения, может отличаться в другом месте гена.

    Для аллелей, сконструированных комплексом MHC, включить гаплотип символа аллеля, аналогично спонтанным мутациям.

    Примеры:

    h3-K b-tm1Bpe целевой мутационный аллель гаплотипа 129P2 / OlaHsd b
    h3-D

    6

    h3-D

    b-tm1126 915 915 915 915 915 915 915 915 915 915 915 915 915 915 Гаплотип OlaHsd b

    h3-Ab1 g7-em1Ygch Сгенерированный CRISPR аллель на гаплотипе g7 NOD

    Крупномасштабные проекты, которые систематически производят большое количество аллелей (> 1000), могут включать аббревиатуру проекта в скобках как часть обозначения аллеля.Они должны сохранять принятые номенклатурные особенности других аллелей этого класса. Например, целевой аллель, созданный Velocigene (Regeneron) в нокаут-проекте КОМП:

    GSTM3 TM1 (КОМП) VLCG

    После полного обозначения в публикации аллель может быть сокращен путем удаления части обозначения аллеля в скобках (в данном случае Gstm3 tm1Vlcg ) при условии, что символ остается уникальным.

    Дополнительные сведения для наименования мутаций и визуализации структур аллелей для целевых мутаций, созданных Международным консорциумом мышей-нокаутов (IKMC), предоставляются отдельно.См. Номенклатуру мутаций IKMC и структуру аллеля IKMC.

    3.5.2 Мутации, опосредованные эндонуклеазами

    Мутации, опосредованные эндонуклеазой, представляют собой целевые мутации, генерируемые в плюрипотентных или тотипотентных клетках эндонуклеазой, присоединенной к специфичным для последовательности доменам связывания ДНК. Мутация вводится во время гомологически направленной или негомологичной репарации с присоединением концов индуцированного разрыва (ов) ДНК.
    Технологии, генерирующие эти типы мутаций, включают TALEN, CRISPR, Cas9 и т. Д. ( c.f. Gaj, et al., 2013; Wijshake, et al., 2014)

    Мутации, опосредованные эндонуклеазами, обозначены символом мутировавшего гена с надстрочным индексом, состоящим из трех частей: символ «em» для обозначения мутации, опосредованной эндонуклеазой, серийный номер лаборатории происхождения и лабораторный код зарегистрированного ILAR лаборатория, в которой была произведена мутация.

    Пример:

    16

    Fgf1 em1Mcw первая индуцированная эндонуклеазой мутация гена фактора роста фибробластов 1 ( Fgf1 ), произведенная в Медицинском колледже Висконсина

    Когда технология редактирования генома эндонуклеазой используется для генерации множественных аллелей, передаваемых зародышевой линией, как, например, в системе Cre-Lox, исходное включение loxP будет соответствовать стандартным рекомендациям по обозначению em #.Если второй наследуемый аллель был затем сгенерирован после скрещивания с трансгенной мышью cre, он сохранил бы обозначение родительского em #, за которым следовали десятичная точка и серийный номер.

    Примеры:

    915 (12) 26Sor em1.1 (CAG-cas9 *, — EGFP) Rsky
    Ptpn6 em1.1Shoy первое производное первой индуцированной эндонуклеазой мутации протеинтирозинфосфатазы, гена нерецепторного типа 6, продуцируемого Sho Yamasaki
    первое производное первой вызванной эндонуклеазой мутации гена ловушки гена ROSA 26, продуцируемого Клаусом Раевски

    Любой аллель, генерируемый CRISPR, всегда является em.

    3.5.3 Мутации генных ловушек

    Мутации генных ловушек символизируются аналогично целевым мутациям. Если захваченный ген известен, символ уловленного аллеля будет аналогичен целевой мутации того же гена с использованием формата Gt (содержимое вектора) #Labcode для обозначения аллеля.

    Пример:

    Akap12 Gt (ble-lacZ) 15Brr аллель генной ловушки гена Akap12 , где вектор-ловушка гена содержит ген устойчивости к флеомицину ( ble ) и lacZ, проанализировано в лаборатории Жаклин Барра (Brr)

    Если захваченный ген является новым, ему следует дать имя и символ, который включает буквы Gt для «генной ловушки», вектор в скобках, серийный номер и лабораторный код.

    • Например, локус гена (ген неизвестен) с использованием вектора ROSA, 26-го, созданного в лаборатории П. Сориано, составляет Gt (ROSA) 26Sor .

    Для высокопроизводительных конвейеров систематических генных ловушек обозначение линии мутантных ES-клеток может использоваться в скобках вместо обозначения вектора, а серийный номер после скобок может быть опущен.

    Примеры:

    Gt (DTM030) Byg для захваченного гена (в неопределенном локусе) в мутантной линии ES-клеток DTM030, созданной BayGenomics
    Osbpl1a Gt (OST4813536 ) Lex
    Аллель-ловушка гена

    оксистерин-связывающего белка, подобного гену 1A, в мутантной линии ES-клеток OST48536, созданной Lexicon Genetics, Inc.

    3.5.4 Ловушки-усилители

    Ловушки-энхансеры — это специализированные трансгены. Одна из возможностей использования этих трансгенов заключается в создании линий Cre-драйверов. Энхансерные ловушки этого типа, которые создаются в настоящее время, могут включать минимальный промотор, интроны, кассету рекомбиназы cre (иногда слитую с другим элементом, таким как ERT2) и сайты полиА из разных источников.

    Номенклатура этих ловушек-энхансеров состоит из следующих 4 частей:

    Et префикс для ловушки энхансера
    Кассета рекомбиназы cre часть в скобках…
    например, cre, icre или cre / ERT2 (при слиянии с ERT2)
    номер строки или серийный номер для обозначения номера лабораторной ловушки или серийного номера
    Код лаборатории Код ILAR, идентифицирующий создателя этой ловушки-усилителя

    Примеры:

    Et (icre) 1642Rdav Ловушка усилителя 1642, Рон Дэвис
    Et (cre / ERT2) 2047Rdav Ловушка усилителя 2047, Рон Дэвис

    Обратите внимание, что минимальный промотор, источник поли A и т. Д.не входят в номенклатуру ловушек энхансеров. Это молекулярные детали конкретной конструкции, которые будут фиксироваться в записях базы данных и сообщаться вместе с результатами экспериментов.

    4 трансгена

    Любая ДНК, которая была стабильно введена в зародышевую линию мышей или крыс, является трансгеном. Трансгены можно разделить на две категории:

    • Те, которые продуцируются гомологичной рекомбинацией как целевые события в определенных локусах
    • Те, которые возникают в результате случайной вставки в геном (обычно с помощью микроинъекции)

    Номенклатура генов-мишеней рассматривается в разделе 3.5. Случайная вставка трансгена в эндогенный ген или рядом с ним может дать новый аллель этого гена. Этот новый аллель следует назвать, как описано
    в разделе 3.4.2. Сам трансген — это новая генетическая сущность, для которой может потребоваться название. В этом разделе описаны рекомендации по названию вставленного трансгена.

    4.1 Символы трансгенов

    Признано, что нет необходимости или даже желательно называть все трансгены. Например, если в публикации описано несколько трансгенных линий, но не все они впоследствии поддерживаются или архивируются, то стандартизованные названия требуются только для тех, которые поддерживаются.Следующее Руководство было разработано межвидовым комитетом при спонсорской поддержке ILAR в 1992 году и изменено Номенклатурным комитетом в 1999 и 2000 годах.
    Трансгенные символы следует отправлять в MGD или RGD через форму номенклатуры для новых локусов. Символ трансгена состоит из четырех частей:

    • Tg обозначает трансген
    • В скобках — официальный символ гена вставленной ДНК с использованием условных обозначений видов происхождения
    • Линия лаборатории или обозначение основателя или серийный номер (обратите внимание, что нумерация не зависит от серии мышей и крыс)
    • Лабораторный код исходной лаборатории

    Никакая часть символа трансгена никогда не выделяется курсивом, поскольку это случайные вставки материала чужеродной ДНК и не являются частью нативного генома.

    Примеры:

    Tg (Zfp38) D1Htz трансген, содержащий мышиный ген Zfp38 , в линии D1, сообщенной Натаниэлем Хайнцем.
    Tg (CD8) 1Jwg трансген, содержащий человеческий ген CD8 , первая трансгенная линия, использующая эту конструкцию, описанная лабораторией Джона В. Гордона.
    Tg (HLA-B * 2705, B2M) 33-3Trg двойной трансген крысы, содержащий человеческие гены HLA-B * 2705 и B2M , которые были введены совместно, давая начало линии 33-3 Джоэла Д.Таурог.

    Знак *, использованный в последнем примере выше, указывает на то, что включенный ген является мутантным.

    Различные трансгенные конструкции, содержащие один и тот же ген, не следует различать символом; они будут использовать один и тот же символ гена в скобках и будут
    отличается серийным номером / кодом лаборатории. Информация о природе трансгенного объекта должна быть предоставлена ​​в соответствующих публикациях и записях в базе данных.

    Во многих случаях большое количество трансгенных линий получают из одной и той же генной конструкции и отличаются только тканевой специфичностью экспрессии.Наиболее распространены трансгены, использующие репортер.
    конструкции или рекомбиназы (, например, ., GFP, lacZ, cre), где промотор должен быть указан как первая часть обозначения вставки гена, отделенная дефисом от репортера или
    обозначение рекомбиназы. Другой пример — большой Т-антиген SV40. В таких случаях полезно использовать обозначения промоторов.

    Примеры:

    Tg (Wnt1-LacZ) 206Amc трансген LacZ с промотором Wnt1 , из линии 206 мышей в лаборатории Andrew McMahon
    Tg (Zp3-creg) 3Mrt с creg Промотор Zp3 , третья линия трансгенных мышей из лаборатории Гейл Мартин

    В случае вставки слитого гена, где примерно равные части двух генов составляют конструкцию, косая черта разделяет два гена в скобках.

    Пример:

    Tg (TCF3 / HLF) 1Mlc трансген, в который были вставлены ген фактора транскрипции 3 человека и ген фактора лейкемии печени в виде гибридной химерной кДНК, первая линия трансгенных мышей, произведенная лабораторией Майкла Л. Клири (Mlc. ).

    Эта схема предназначена только для наименования трансгенного объекта. Штамм мышей или крыс, на которых сохраняется трансген, следует называть отдельно, как в Правилах и рекомендациях по номенклатуре штаммов мышей и крыс.При описании трансгенной линии мыши или крысы название штамма должно предшествовать обозначению трансгена.

    Примеры:

    C57BL / 6J-Tg (CD8) 1Jwg штамм мышей C57BL / 6J, несущий трансген Tg (CD8) 1Jwg.
    F344 / CrlBR-Tg (HLA-B * 2705, B2M) 33-3Trg Штамм крысы F344 / CrlBR, несущий Tg (HLA-B * 2705, B2M) 33-3Trg двойной трансген

    Для трансгенных ВАС вставка обозначена как клон ВАС и соответствует тому же соглашению об именах, что и Реестр клонов в NCBI.

    Пример:

    Tg (RP22-412K21) 15Som трансген ВАС, где вставленный ВАС из библиотеки ВАС RP22, планшет 412, строка K, столбец 21.
    Это 15-я мышь, созданная в лаборатории Стефана Сомло (Сомо).

    Трансгены, содержащие конструкции РНКи, можно обозначить минимально как:

    Tg (RNAi: geneX) #Labcode, где
    geneX — ген, который сбивается
    # — порядковый номер трансгена

    Расширенная версия этого обозначения:

    Tg (Pro-yyRNAi: geneX) #Labcode, где
    Pro- может использоваться необязательно для обозначения промотора
    yy может использоваться необязательно для конкретной конструкции RNAi16