Невидимата заплаха на хардуерните дефекти
Абонирайте се за Капитал

Всеки петък икономически анализ и коментар на текущите събития от седмицата.
Съдържанието е организирано в три области, за които Капитал е полезен:

K1 Средата (политическа, макроикономическа регулаторна правна)
K2 Бизнесът (пазари, продукти, конкуренция, мениджмънт)
K3 Моят капитал (лични финанси, свободно време, образование, извън бизнеса).

Абонирайте се за Капитал

Невидимата заплаха на хардуерните дефекти

Reuters

Невидимата заплаха на хардуерните дефекти

Значителна част от проблемите при компютрите се крият в неизправност на оперативната памет или видеокартите, като понякога са маскирани като софтуерни недостатъци

Юлиян Арнаудов
7527 прочитания

Reuters

© Reuters


Компютърният евфемизъм бъг (от английската дума bug – буболечка) идва от времето, когато компютрите са били с размерите на цели стаи. Терминът се популяризира от Грейс Хопър и по-точно това прави нейния разказ, в който описва проблем с машината Mark II (разработен през 1947 г.). Един ден компютърът спрял без каквато и да е видима причина, При направената проверка се оказало, че нощна пеперуда се заклещила в едно от релетата. След като внимателно била премахната, компютърът заработва отново, без да дава грешки.

Терминът бъг все повече се използва за илюстриране на само на софтуерни проблеми. През последните години все повече се налага мнение, че по-голямата част от случаите, свързани със забавяне и забиване на компютрите, се дължи главно на проблеми в програмите или на плъзналите в глобалната мрежа вируси. Но като всякакъв тип техника, особено прецизна и изчислителна, тя също се износва или пък дава дефекти. Много често зад проблеми, които си мислим, че са софтуерни, стоят неизправности в хардуера. Така бъгът в системата всъщност може да се окаже, ако не пеперуда, заклещена в реле, поне дефектен или износен компонент.

"Меките грешки"

Докато потребителите продължават да обвиняват операционната система, програмите или знайни и незнайни вируси, учените през последните няколко години започнаха да изследват все по-задълбочено хардуера като потенциален източник за евентуалните проблеми. Производителите на чипове и компоненти полагат големи усилия да тестват своите продукти дали работят, преди да ги доставят на своите клиенти. От масовизацията на персоналните компютри в края на 70-те години на миналия век досега микрочиповете се изработват в стерилна среда. Но дори и при най-чистите условия вътре в транзисторите има възможност да попаднат различни частици, които във времето могат да доведат до дефект. Миниатюризацията на процесорите улеснява този процес, като дори най-малката попаднала по погрешка частица може да причини значителни щети по чипа.

Производителите наричат този процес "меки грешки". Те обаче са само част от източниците на хардуерни дефекти. През последните пет години различни учени изследват задълбочено компютърните системи и причините за лоша функционалност. В повечето случаи това не е нито софтуерът, нито попадналите при производство частици. В някои случаи използваните компоненти просто не са функционирали правилно. Топлината, отделяна при работа, или други дефекти при производство довеждат до по-бързото износване на частите. По този начин електроните понякога могат да преминават от един транзистор в друг. В един момент може да се стигне и до разпад на връзките на чипа. Съответно всичко това води до срив или намалена работоспособност на системата.

Проблем с паметта

Според малък изследователски екип от Университета в Торонто оперативната памет на компютъра (DRAM) е едно от слабите звена на системата. Когато тя даде дефект, той в повечето случаи се дължи на стара част или лошо производство. През 2007 г. водещият учен на екипа професор Биана Шрьордер получава достъп до дейта центровете на Google, където компанията трупа огромно количество информация за това кога специално разработените системи, базирани на Linux, спират да функционират. Изследователката открива повече грешки и дефекти от очакваното.

По-интересното обаче е, че 8% от чиповете с оперативна памет на Google са отговорни за 90% от проблемите на сървърите. Понякога те дават по един дефект на няколко минути. При по-задълбочено изследване Шрьодер и нейният екип откриват, че повечето грешки се концентрират в някои конкретни части на паметта и тенденцията е това да се случва при по-старите платки. През 2009 г. учените публикуват разкритията си, а в началото на тази година пускат записките от второ изследване, което е проведено на оперативната памет, използвана от системата на IBM Blue Gene и на канадския суперкомпютър SciNet. Във всички системи нивата на грешки при DRAM се запазва. Подобни разкрития, макар и с по-малко конкретика, публикува и производителят на чипове AMD.

Признат половин грях...

"Това не е нов проблем", коментира Вилас Шридхаран, инженер в AMD и автор на доклада на компанията за дефектите в оперативната памет, цитиран от авторитетното технологично списание Wired. "Грешките в DRAM платките са открити още през 1979 г., но ние все още се учим от тях." Най-големият производител на DRAM памети – Samsung, пък коментира единствено, че "не разполагат с конкретни данни по въпроса".

Наличието на тези чисто хардуерни проблеми обаче се неглижира, като се използват различни трикове и техники за намаляването на ефектите от допуснатите грешки. Това става чрез използването на коригиращ код, който възстановява данните от допуснатите "меки грешки". Той обаче не може да компенсира по-сериозните физически дефекти. Подобни механизми все пак са налични за високотехнологичните суперкомпютри и големи сървърни машини. При обикновените потребителски системи ситуацията е различна и те не разполагат с такива коригиращи кодове.

Хардуер, маскиран като софтуер

Има и друг момент – DRAM е налична не само в отделните платки на оперативната памет, но също така и в други компоненти, най-вече видеокарти. По този начин се увеличава вероятността цялата система да забие заради дефект в хардуера. Друг проблем за потребителите е, че понякога хардуерен дефект може да се маскира като софтуерен. Тоест компютърът да действа по-бавно от обичайното, да зарежда трудно интернет страници или при по-голямо натоварване да реагира зле. Някои веднага ще обвинят за това операционната система или вируси. Но причината може да е именно дефект на видеокартата или оперативната памет. За да се определи дали проблемът е хардуерен, в повечето случаи е необходима или диагностика със специализирана програма, или да се изпробват други компоненти. Ако дефектът на хардуера е прекалено сериозен, тогава е лесно – просто системата престава да работи или пък показва признаци за липса на хардуерна функционалност (син екран без надписи например). Така например преди две години спира да работи един голям рекламен дигитален екран в центъра на Торонто, като за причината се предполага, че е или дефектна оперативна памет, или видеокарта.

Затова не трябва да се изненадвате, ако зад лошата работа на вашето РС се крие хардуерен проблем, а не неоптимизиран софтуерен код на операционната система или пък промъкнал се през глобалната мрежа вирус.

Компютърният евфемизъм бъг (от английската дума bug – буболечка) идва от времето, когато компютрите са били с размерите на цели стаи. Терминът се популяризира от Грейс Хопър и по-точно това прави нейния разказ, в който описва проблем с машината Mark II (разработен през 1947 г.). Един ден компютърът спрял без каквато и да е видима причина, При направената проверка се оказало, че нощна пеперуда се заклещила в едно от релетата. След като внимателно била премахната, компютърът заработва отново, без да дава грешки.

Терминът бъг все повече се използва за илюстриране на само на софтуерни проблеми. През последните години все повече се налага мнение, че по-голямата част от случаите, свързани със забавяне и забиване на компютрите, се дължи главно на проблеми в програмите или на плъзналите в глобалната мрежа вируси. Но като всякакъв тип техника, особено прецизна и изчислителна, тя също се износва или пък дава дефекти. Много често зад проблеми, които си мислим, че са софтуерни, стоят неизправности в хардуера. Така бъгът в системата всъщност може да се окаже, ако не пеперуда, заклещена в реле, поне дефектен или износен компонент.


Благодарим ви, че четете Капитал!

Вие използвате поверителен режим на интернет браузъра си. За да прочетете статията, трябва да влезете в профила си.
Влезте в профила си
Всеки потребител може да чете до 10 статии месечно без да има абонамент за Капитал.
Вижте абонаментните планове

13 коментара
  • 1
    bpetkov avatar :-P
    Bob Parr

    Накратко - ако не е софтуерно то ще е хардуерно (и обратно)

  • 2
    pavelbg avatar :-P
    pavelbg

    Що за глупости?!
    "Това става чрез използването на коригиращ код, който възстановява данните от допуснатите "меки грешки". Той обаче не може да компенсира по-сериозните физически дефекти. Подобни механизми все пак са налични за високотехнологичните суперкомпютри и големи сървърни машини."

    НЯМА сървър ползващ нормална памет. Това което ползваме в домашните си компютри не може да се инсталира дори в евтин сървър от 300-400 паунда, там се ползва единствено ECC memory, за по-добрите сървъри дори REG. Всеки нормален интернет потребител може да ползва гугъл, да не говорим колко лесно е да се провери с поръчване на сървър от дел - конфигуратора си показва типа памет.

    Домашните пц-та които отдават под наем хецнер като сървъри са друга бира - те ползват евтин хардуер с i5 и i7 процесори и декстоп рам вместо Xeon и ECC памет.

    Хората пишещи тези статии отваряли ли са някога сървър?! :)

  • 4
    tarator9 avatar :-|
    tarator9

    s/бъщата/бащата/

  • 5
    tarator9 avatar :-|
    tarator9

    До коментар [#2] от "pavelbg":

    Освен простия ECC има chipkill и т.н. и т.н. Статията е напълно безмислена, преписана от някой който няма никаква идея какво превежда.

  • 6
    dax avatar :-?
    dax

    "Негов своеобразен баща е компютърния пионер Грейс Хопър и по-точно негов е разказът..."

    Грейс Хопър (Grace Hopper), г-н Арнаудов, е жена. Термините bug и debugging не са въведени от нея в употреба, което тя потвърждава в свое интервю. Допуска се, че въпросната случка с молеца допринася за възприемането и широкото разпространение на тази терминология в контекста на изчислителната техника (не казвам екектронноизчислителна, защото по това време тя основно е електромеханична). Ако това е така, за това трябва да бъдат държани отговорни и хората от нейния екип, обслужващи Harvard Mark II.

    Етимологията на тези термини все още не е напълно изяснен, но никой не може да се оплаче от липса на литература по този въпрос.

  • 7
    a_lizzard avatar :-|
    a_lizzard

    Всъщност Грейс Хопър е жена: http://en.wikipedia.org/wiki/Grace_Hopper

  • 8
    e_mil avatar :-|
    tamada

    Оперативната памет е RAM.
    DRAM е само един от видовете.

  • 9
    2.5 avatar :-P
    2.5

    До коментар [#6] от "dax":

    "Терминът се популяризира от Грейс Хопър и по-точно това прави НЕЙНИЯ разказ, в който описва проблем с машината Mark II (разработен през 1947 г.)"

    Напразно обвинявате човека - написал го е още във второто изречение.

  • 10
    daria_vip avatar :-|
    daria_vip

    Зонирането на света драги ,зонирането на света по качествени зони .
    България ,източна европа не попада дори на картите за доставка.
    Тук пристига най големият високотехнологичен отпадък който е квалифициран като неприемлив в качествено отношение за зона 1 .

    Затова ако имате възможност купувайте си електроника от зона 1 за да ви е мирна главата не че няма възможност да изхори но в качествено отношение е на светлинни години от това което продава и техномаркет и всички в източна европа .


Нов коментар

За да публикувате коментари,
трябва да сте регистриран потребител.


Вход

Още от Капитал

С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. OK