Vad är Amazon Redshift Data Warehouse System Architecture?

Vad Ar Amazon Redshift Data Warehouse System Architecture



Hosting och hantering av data i databaser och datalager har alltid varit en hektisk och besvärlig uppgift. Det kräver mycket resurser och beräkningskraft för att förstå data. Amazon Web Services har en enda lösning för detta ändamål. Den har en tjänst som heter Amazon Redshift som helt hanterar användarnas datalager.

Den här artikeln kommer att förklara Amazon Redshift i detalj tillsammans med dess datalagerarkitektur. Alla komponenter i Redshifts datalagersystemarkitektur kommer att förklaras i detalj.







Vad är Amazon Redshift?

IT är en datalagertjänst som tillhandahålls av Amazon. Den hanterar och analyserar effektivt stora datamängder för analys och rapportering. Den är byggd på en pelarformad förvaringsmodell. Den använder kluster av beräkningsnoder som kontrolleras av en ledarnod för att tillhandahålla högpresterande databehandling.



Det tar data från olika källor och slår samman dem för att skapa ett datalager. Den erbjuder olika funktioner, såsom datadelning och realtidsanalys. Se bilden nedan för att förstå funktionerna och funktionerna hos Amazon Redshift:







Låt oss gå till dess datalagersystemarkitektur nu.

Vad är Amazon Redshift Data Warehouse System Architecture?

Denna systemarkitektur har tre kärndelar. Dessa delar är:



  • Lagring
  • Acceleration
  • Beräkning

Låt oss förstå deras syften:

Lagring
Lagringsdelen handlar om lagringstjänster som Redshift har. Den har sitt eget alternativ för hanterad lagring samt ett S3-hinkalternativ.

Acceleration
Accelerationsdelen är beroende av lagringstjänsten som används och den beräkningskraft som används. Redshift-hanterad lagring är snabbare jämfört med andra lagringsalternativ

Beräkning
Beräkningsdelen handlar enbart om datorkraft som används. Beräkning görs med kluster och kluster har noder. Noder har i sin tur skivor.

För att bättre förstå alla element och komponenter i denna arkitektur, se bilden nedan:

Låt oss förstå dess komponenter en efter en.

Vilka är de arkitektoniska komponenterna i Amazon Redshift?

Följande är de arkitektoniska komponenterna i Amazon Redshift:

  • Kluster
  • Knutpunkter
  • Nodskivor
  • Lagring
  • Internt nätverk
  • Databaser

Låt oss diskutera dessa en efter en:

Kluster
Ett kluster är den grundläggande och kärnenheten. Den består av ett antal noder. Om ett kluster består av flera beräkningsnoder, kliver en ytterligare ledarnod in för att koordinera dessa beräkningsnoders aktiviteter och hantera extern kommunikation.

Knutpunkter

Noder i kluster är av två typer. Dessa är:

  • Ledarnod
  • Beräkna nod

Låt oss förstå dessa efter en:

Ledarnod
Den hanterar kommunikation med klientprogram och koordinerar interaktioner med beräkningsnoder. Ledarnoden spelar en viktig roll för att utföra komplexa frågor. Den kompilerar kod baserat på exekveringsplanen som distribueras till beräkningsnoder och tilldelar datadelar till varje enskild beräkningsnod.

Beräkna nod
Beräkningsnoder är ryggraden i Amazon Redshifts arkitektur. De utför både lagring och behandling av data. Dessa har dedikerade resurser, såsom minne och CPU.

Nodskivor
Beräkningsnoder är ytterligare uppdelade i skivor. Dessa delar arbetar tillsammans för att bearbeta tilldelade arbetsbelastningar och uppnå parallellitet för att förbättra frågebehandlingen.

Lagring
Datalagring inom Amazon Redshift hanteras av 'Redshift Managed Storage (RMS)'. Den har förmågan att skala lagring oberoende med hjälp av 'Amazon S3'-lagring. RMS använder högpresterande SSD-baserad lokal lagring som tier-1 cache vilket optimerar prestandan.

Internt nätverk
Detta interna nätverk i Amazon Redshift hjälper till med snabb och säker kommunikation mellan ledarnoder och beräkningsnoder. Detta nätverk är inte direkt tillgängligt för klientapplikationer.

Databaser
Kluster har en eller flera databaser. Data från dessa databaser finns på beräkningsnoder. Klientapplikationer kommunicerar med ledarnoden. Beräkningsnoden hanterar frågekörning över beräkningsnoder.

Det här handlar om Amazon Redshift och dess arkitektoniska element. Den här artikeln har utförligt förklarat de fungerande komponenterna i Amazon Redshift

Slutsats

Arkitekturen hos Amazon Redshift är orsaken till dess kapacitet. Ledarnoden styr och hanterar beräkningsnoderna och nodsegmenten hjälper till vid parallell bearbetning. Redshift Managed Storage använder SSD-baserad lagring för att förbättra prestandan. Den här artikeln har förklarat Amazon Redshift Data Warehouse System Architecture.