Car-tech

Oracle Engineer avslører latensmysterier med varmekart

HOW A MECHANICAL ENGINEER GOT SELECTED AS A SOFTWARE DEVELOPER AT ORACLE | HOW TO GET INTERNSHIP

HOW A MECHANICAL ENGINEER GOT SELECTED AS A SOFTWARE DEVELOPER AT ORACLE | HOW TO GET INTERNSHIP
Anonim

Selv om datasentreforvaltere lenge har brukt varmekart for å avgjøre hvor de beste plasseringsradene til servere og kjøleenheter er, kan denne visualiseringsmodusen også være nyttig for bedre forståelse av systemlatens, argumenterer en Oracle-ingeniør i juli-utgaven av Kommunikasjon av ACM.

"Presentasjon av latens som et varmekart er en effektiv måte å identifisere subtile egenskaper som ellers kan bli savnet," skriver Brendan Gregg, en hovedprogramvareingeniør hos Oracle, i artikkelen "Visualisering av systemets latens".

Gregg advarer også om at mens slik visualisering kan gi oss større oversikt over hva som skjer, gir det ikke alltid svar på atferden som observeres. Likevel kan varmekart gir innsikt i å takle neste generasjon av data-center latensproblemer.

[Videre lesing: Best NAS-bokser for media streaming og backup]

Ved å markere årsakene til systemtugghet har det lenge vært en frustrasjon for datasenterledere og systemadministratorer. Nettverksanalyseværktøy er tilgjengelige for å visualisere nettverksytelsen, selv om andre aspekter av et system, for eksempel diskens reaksjon i et lagringsarrangement, har vært vanskeligere å kvantifisere.

Sun Microsystems har lenge tilbudt ett verktøy for sitt Solaris-operativsystem, kalt DTrace, som kan karakterisere latens innen ulike deler av et system i andre omgang. De overveldende dataene den kan produsere, må imidlertid kokes ned i en lettforståelig form.

Skriv inn Greggs varmekart. Varmekart er en enkel visualiseringsteknikk der i todimensjonale grafer forskjellige verdier representeres av forskjellige farger.

Varmegrafer kan vise mer enn linjediagramene på de fleste nettverksanalyseværktøy, fordi mens grafer "tillater gjennomsnitt latens for å bli undersøkt over tid, kan den faktiske sminke eller distribusjon av latens ikke bli identifisert utover maksimalt, hvis det er gitt, skriver han.

Varmekart er også bra for raskt å identifisere avvikere, som deretter kan undersøkes mer detaljert, argumenterte han.

For artikkelen tegnet Gregg en rekke uvanlige arbeidsbelastningsforhold, ved hjelp av Oracle Analytics-visualiseringsprogramvaren for å visuelt gjengi data samlet av DTrace. Han satte X-aksen for å representere tid og Y-aksen for å representere ventetiden. De mørkeste fargene representerte de fleste innspillingsdata.

I mange tilfeller fant han at enkle arbeidsbelastninger kan produsere en rekke komplekse - og noen ganger uforklarlige - mønstre.

I ett tilfelle var en liten mengde data sekvensielt skrevet til et basseng av disker. Gregg forventet å se bare "hvit støy" som representerer tilfeldig latens som skal vises. I stedet viste varmekartet at latensnivåene stiger og faller i forskjellige mønstre av en eller annen ukjent grunn. "Visualiserende latens på denne måten tydeliggjør flere spørsmål enn det gir svar," sa han.

Et annet mønster viste seg like mystisk. Testen involverte å sende en datastrøm til 44 disker. For det første vil data sendes til bare en disk, deretter til to disker og så videre, til alle 44 disker mottok data.

Gregg forventet at disketiden skulle øke lineært når systembussene ble mettet med data.

I stedet vil latensen øke, deretter avta noe, før du øker noe mer.

Han kalte dette mønsteret regnbue pterodactyl, idet varmegrafen likte profilen til en fargerik flygende dinosaur.

"For å oppsummere regnbue pterodactyl: lite er kjent med nøyaktighet, og mye mer etterforskning er nødvendig. Det som viser dette er hvor dypt en enkel visualisering kan bli, "skriver han.

Gregg brukte også et varmekart for å avdekke sjokseffekter som høy lyd har på servere, fenomener som Gregg demonstrerte noen år tilbake på YouTube.

Selv om disse varmekartene ble gjort på et system som kjører på Zettabyte File System (ZFS), som kjører over NFS-protokollen (Network File Storage), kan denne tilnærmingen brukes til å karakterisere operasjonene til andre filsystemer, og til og med andre komponenter som CPUer, Gregg skriver.

Joab Jackson dekker enterpise-programvare og generell teknologi-breaking news for IDG News Service. Følg Joab på Twitter på @Joab_Jackson. Joabs e-postadresse er [email protected]