Кто виноват? Crew Dragon…

12:29 27/03/2021
Комментарии 1 👁 1 656

24 марта в нашем журнале “Всё о Космосе” мы сообщили о том, что причиной ложного сигнала о пожаре и разгерметизации на МКС стал пилотируемый корабль  Crew Dragon.

“Некорректная работа программного обеспечения корабля компании SpaceX стала причиной ложного срабатывания сигнализации. Такая информация следует из переговоров экипажа станции с Землей, транслируемых NASA 24 марта.”

Источник РИА Новости в ракетно-космической отрасли сообщил, что ложный сигнал поступил с американского сегмента станции.

“ложную сигнализацию о пожаре и разгерметизации на МКС вызвало попадание заряженной частицы в электронику пилотируемого корабля Crew Dragon. На ложные сигналы с Crew Dragon отреагировала система аварийной сигнализации на МКС, а сигнал о пожаре в российском модуле “Заря” был связан с некорректной работой датчиков дыма. Блок электроники на корабле перезапущен и работает нормально.”

Вадим Лукашевич

Вадим Лукашевич на своей странице пишет

Как это было.
В 10:42:19 по декретному московскому времени в российском сегменте произошло срабатывание аварийной сигнализации с формированием сообщений класса Emergency – «Пожар» и «Разгерметизация».

Анализ телеметрической информации в подмосковном Центре управления полетом и измерения, выполненные экипажем на борту станции (показатели давления, показания газоанализатора CSA-CP и визуальный осмотр) показали, что срабатывание сигнализации было ложным. В соответствие с работой алгоритма парирования разгерметизации на российском сегменте МКС произошло автоматическое отключение систем очистки от углекислого газа «Воздух», системы кондиционирования, вентиляции, блока удаления вредных микропримесей из воздуха, пультов ППС-31, ППС-26, и газоанализаторов ИК-0501, ГЛ2106 и др.

Выяснилось, что источником первоначальных аварийных сообщений является американский корабль Dragon Crew-1. По докладу Центра управления полетов в Хьюстоне, на корабле была зафиксирована нештатная работа компьютера VVP (Visiting Vehicle Processor), отвечающего за межмашинный обмен между Dragon и МКС. После выполнения перезапуска этого компьютера замечаний к его работе не наблюдается.

Теперь в качестве дружеского ответа американцы ждут анонимного телефонного звонка о минировании Dragon Crew-1

Хабр сообщает

Анализ этого инцидента, проведенный НАСА, предполагает, что он «был вызван радиацией», а вероятность повторения подобного является «низкой». Представители агентства уже заявляли, что радиация иногда может переключать биты внутри компьютеров и заставлять их работать неправильно.

В настоящее время на МКС также ведется прокладка гигабитного кабеля Ethernet в Joint Station LAN. Бригада проложила новый кабель от переднего оконечного конуса Node 1 к порту Node 1.

В феврале на космическую станцию отправили HPE Spaceborne-2 — высокопроизводительный компьютер, приспособленный к специфическим условиям МКС. Его основой стала конвергентная платформа для периферийных вычислений HPE Edgeline EL4000. Вычислительные узлы — серверы HPE ProLiant DL360 последнего поколения с двумя процессорами Intel Xeon Cascade Lake и ускорителями NVIDIA T4. Оба модуля будут использовать для связи между собой сеть 10GbE.

NASASpaceFlight

Возможно, что причиной сбоя является космическая радиация. Такие события называются “нарушением в результате единичного события” (single-event upset, SEU).

Chris B – NSF: “Crew Dragon Resilience держит команду МКС в напряжении”

Репортер Tyler Gray: “причина в “Single Event Upset (SEU) ” (одиночный сбой) на одном из блоков питания Crew Dragon, вызвавшем перезагрузку процессора, и выдав данные, которые система на МКС (ISS) интерпретировала как совокупность аварийных ситуаций и нештатных сигналов. ”

ISS: “Вероятно, проблема заключалась в сбое (SEU) в блоке авионики Power Unit 2B (основной шлюз Dragon 1553 ). Излучение (SEU) заставило процессор сбросить настройки и выдать данные, которые система на МКС интерпретировала как совокупность аварийных сигналов и нештатных сообщений.”

По словам Tyler Gray, этот сбой был результатом внезапного увеличения ионизирующей космической радиации, некоторые СМИ написали “по типу bitflip”.

 

 

“Single Event Upset (SEU) “- самоустранимый отказ
Вид кратковременного отказа, когда после окончания внешнего воздействия (например, в виде сильных доз радиации) радиооборудование восстанавливает свою работоспособность сразу же или через определенный период времени.
[Л.М. Невдяев. Телекоммуникационные технологии. Англо-русский толковый словарь-справочник. Под редакцией Ю.М. Горностаева. Москва, 2002]

Техносфера пишет

SEU вызывают в массивах памяти одиночные (Single Bit Upset, SBU), а иногда и
мультибитовые сбои (Multiple Bit Upset, MBU), которые можно устранить путем
перезаписи в соответствующие ячейки памяти правильных значений. События SEL,
имеющие еще название тиристорного эффекта, самые опасные из одиночных сбоев:
при отсутствии средств защиты они могут стать причиной необратимого отказа.

Одиночные сбои снижают надежность систем, если не принимать никаких мер
для их предотвращения. В космосе, за пределами защиты магнитосферы Земли,
SEU становятся крайне острой проблемой из-за высоких уровней радиации.
SEU могут приводить к серьезным последствиям для космического аппарата,
таким как потеря информации, сбои в функционировании или утрата контроля,
например ошибочное выполнение прикладной программы.

Эффекты, вызванные воздействием ионизирующего излучения, носящие
название одиночных событий ( SEE — Single Event Eff ects), могут приводить
к восстанавливаемым (кратковременным) или постоянным
(невосстанавливаемым) отказам.

Когда SEE проявляется кратковременно, его принято называть устранимой
ошибкой (или однократным восстанавливаемым отказом), поскольку
устройство не получило необратимого повреждения.
Примером устранимой ошибки является одиночный сбой ячейки памяти
( SEU —Single Event Upset) и случайный одиночный сбой переключения
выхода логического элемента ( SET — Single Event Transient).

Следует отметить, что понятие устранимой ошибки не уменьшает серьезности
вызванных радиацией ошибок.

Для тестирования механизмов обнаружения и коррекции сбоев используют
иъектирование ошибок в памяти микропроцессора. Инъектирование имитирует
результат воздействия космических тяжелых заряженных частиц.

Обеспечение сбоеустойчивости микропроцессоров, работающих в составе бортовой космической аппаратуры, является важнейшей задачей элетронного космического приборостроения. Для предотвращения подобных сбоев используют
помехоустойчивые коды, позволяющие находить и автоматически исправлять
ошибки в памяти.

Ранее в нашем журнале “Всё о Космосе” мы также рассказывали , что причиной отказа командного передатчика радиотелескопа “Спектр-Р” могла стать космическая радиация, накопившаяся в электронике аппарата за несколько лет полета. “В качестве причины неработоспособности приемо-передающего устройства “Спектра-Р” специалисты предполагают влияние дозы радиации, накопленной за период полета в электронной компонентной базе спутника“. Позже Президент Российской академии наук Александр Сергеев сообщил о завершении научной миссии проекта “Радиоастрон”, в рамках которого был запущен орбитальный телескоп “Спектр-Р”. “Спектр-Р” запущен в космос в июле 2011 года.

В 1972 году спутник Hughes испытал сбой, когда связь со спутником была потеряна на 96 секунд, а затем восстановлена. 

Космические лучи — причина случайных компьютерных сбоев

7 октября 2008 года авиалайнер Airbus A330-303 компании Qantas Airways шёл по маршруту из Перта (Австралия) в Сингапур. На высоте 11 300 метров произошёл сбой в одном из трёх опорных инерциальных блоков, в результате чего в компьютерную систему управления были отправлены некорректные данные. По этой причине самолёт резко ушёл вниз, подкинув вверх пассажиров, которые не были пристёгнуты ремнями безопасности. Травмы получили 110 из 303 пассажиров, а также 9 из 12 членов экипажа. Среди пассажиров 12 человек получили серьёзные травмы, а ещё 39 человек обратились в больницу. Среди всех возможных причин сбоя инерциального блока осталась неисключённой только SEU, остальные признаны «маловероятными» или «очень маловероятными». Однако Австралийский совет по безопасности транспорта посчитал «недостаточными свидетельства для оценки вероятности», что именно SEU стала причиной сбоя.

Хотя на Земле вероятность единичного сбоя из-за космического излучения в 300 раз ниже, чем на высоте 9000 метров, но иногда этому явлению приписывают самые необъяснимые события, которые происходят с компьютерной техникой. Например, в 2003 году машина для электронного голосования в городе Схарбек (Бельгия) добавила 4096 голосов одному из кандидатов на выборах. Расследование показало, что этот сбой был вызван изменением одного бита в памяти устройства. Причиной назвали космическое излучение. Что характерно, ошибку обнаружили только благодаря тому, что кандидат получил больше голосов, чем было возможно. Иначе бы сбой остался незамеченным.

«Это действительно большая проблема, но она в значительной степени остаётся незаметной для общества», — говорит Бхарат Б’ува (Bharat Bhuva), член научно-исследовательской группы по изучению эффектов радиации (Radiation Effects Research Group) и профессор электротехники в Университете Вандербильта (США). Эта исследовательская группа была образована в 1987 году в том числе для изучения влияния космического излучения на электронные системы. Первоначально группа занималась военными и космическими системами, но с 2001 года расширила сферу интересов и на бытовую электронику.

Хотя существуют довольно яркие примеры сбоев техники, SEU остаются исключительно редким феноменом. Но специалисты обращают внимание, что электронные микросхемы всё чаще используются в различных бытовых приборах. Плотность транзисторов на чипах возрастает, как и их количество. Из-за этого вероятность встречи с «космическим сбоем» растёт с каждым годом. Производители электротехники изучают проблему. Например, в 2008 году инженеры компании Fujitsu забрались на гавайский вулкан, чтобы измерить космическое излучение на высоте 4200 метров. Там оно примерно в 16 раз выше, чем на уровне моря.

Для защиты от космического излучения производители бытовой электроники пытаются использовать менее чувствительные материалы и коды исправления ошибок (error-correction codes). В более дорогих устройствах можно применять системы дублирования.

Сбоеустойчивость – это свойство системы, например микропроцессора,
продолжать свое нормальное функционирование в случае одного или
нескольких сбоев некоторых из своих компонентов. 

У инженеров, системных администраторов и программистов теперь есть отличная “отмазка”, чтобы объяснить странные глюки компьютерной техники.

Подробнее о механизме сбоя здесь.

Ранее Dragon-2 обвиняли в появлении запаха изопропилового спирта, который появился на МКС после его прибытия, и сообщали, что запах “выветрится” из атмосферы станции после ухода корабля.

А журналистка издания WIRED, Sarah Scoles опубликовала статью под названием “A SPACEX DELIVERY CAPSULE MAY BE CONTAMINATING THE ISS”, в которой выразила обеспокоенность тем, что компания SPACEX загрязняет МКС при доставке грузов кораблями снабжения Dragon. И я задала вопрос: а как насчет других грузовиков? Что только Dragon загрязняет МКС? Остальные пахнут розами?

Есть старый анекдот, о том кто виноват, но это не для печати. 

Ждем официальных объяснений….

Ирина Дорошенко (Filipok)

Дорогие друзья! Желаете всегда быть в курсе последних событий во Вселенной? Подпишитесь на рассылку оповещений о новых статьях, нажав на кнопку с колокольчиком в правом нижнем углу экрана ➤ ➤ ➤

One Comment

  1. Получены уникальные данные для полетов в дальнем космосе!
    Конструкторам, пограммистам есть над чем работать.
    Радиационно стойкая схемотехника существует:
    https://habr.com/ru/post/452128/

Добавить комментарий