Bil

De fem bästa programmeringsspråken som datavetare borde lära sig

Dataforskare som arbetar med stora datamängder eller i högpresterande beräkningsmiljöer kan tycka att dessa programmeringsspråk är viktiga för att extrahera data snabbt och enkelt.

Bild: metamorworks, Getty Images/iStockphoto

Datavetenskap är ett område fokuserat på att extrahera kunskap från data. Sätt i lekmannatermer, få detaljerad information genom att tillämpa vetenskapliga begrepp på stora uppsättningar data som används för att informera beslutsfattande på hög nivå. Ta den pågående globala covid-19-pandemin till exempel: Regeringstjänstemän analyserar datamängder som hämtats från en mängd olika källor, som kontaktspårning, infektion, dödlighet och platsbaserade data för att avgöra vilka områden som påverkas och hur man bäst anpassar -pågående stödmodeller för att ge hjälp där det behövs som mest samtidigt som man försöker stävja infektionsfrekvensen.

SER: Topp 5 programmeringsspråk för dataforskare att lära sig (gratis PDF) (TechRepublic)

Måste läsa big data-täckning

Big data, som det ofta kallas, är den kollektiva aggregeringen av stora uppsättningar data hämtade från flera digitala källor. Dessa datasträngar tenderar att vara ganska stora i storlek, variation (typer av data) och hastighet (hastigheten med vilken data samlas in). Detta beror på den explosiva tillväxten och digitaliseringen av information globalt och den ökade kapaciteten att lagra, hantera och analysera datapooler av denna storleksordning.

Datavetenskap, som f√∂rest√§llts av Jim Gray, en datavetare och mottagare av Turing Award, trodde att det var vetenskapens “fj√§rde paradigm” ‚Äď att l√§gga till datadrivet efter empiri, teoretisk och ber√§kningsteknik. Med detta i √•tanke √§r programmeringsspr√•ken nedan redo att vara effektiva i sin hantering av stora datam√§ngder och robusta i sin sammansm√§ltning av flera datak√§llor f√∂r att effektivt extrahera den information som kr√§vs f√∂r att ge insikt och f√∂rst√•else av fenomenen som finns inom datastr√∂mmar f√∂r datautvinning och maskininl√§rning, bland annat.

SER: Big datas roll i COVID-19 (gratis PDF) (TechRepublic)

Pytonorm

Python har hyllats av både mjukvaruutvecklare och datavetare och har visat sig vara det bästa programmeringsspråket både för dess användarvänlighet och dess dynamiska karaktär. Den är mogen och stabil, för att inte tala om kompatibel med högpresterande algoritmer, vilket gör att den kan samverka med avancerad teknik som maskininlärning, prediktiv analys och artificiell intelligens (AI) genom rika, stödda bibliotek i dess omfattande ekosystem. Utöver dess styrkor som ett djupinlärningsspråk, åtnjuter Python också nästan oöverträffat stöd över en mängd olika operativsystem för att hjälpa till med databehandling från nästan vilken källa som helst.

SER: Python äter världen: Hur en utvecklares sidoprojekt blev det hetaste programmeringsspråket på planeten (TechRepublic omslagsberättelse PDF)

R

R jämförs ofta med Python genom att dess inneboende styrkor liknar varandra på grund av dess öppen källkod och systemagnostiska design för att stödja de flesta operativsystem. Och medan båda språken utmärker sig inom datavetenskap och maskininlärningscirklar, designades R av och lutar sig mycket mot statistiska modeller och datoranvändning. Att utforska data erbjuder ett antal operationer som kan utföras för att sortera och generera data, modifiera, slå samman och korrekt distribuera datamängder för att göra dem redo för sin slutliga representativa formatering. Slutligen är datavisualisering en annan punkt där R specialiserar sig, med ett antal paket som hjälper till att grafiskt representera resultat med diagram och plotter, inklusive komplex plottning av numerisk analys.

SER: R programmeringsspråk fortsätter att växa i popularitet (TechRepublic)

Java

Java har funnits i ungef√§r ett kvarts sekel och under denna tid har det klassbaserade, objektorienterade spr√•ket anslutit sig till trosbek√§nnelsen “write once, run anywhere (WORA)” och etablerat att det kr√§ver s√• f√• beroenden som m√∂jligt. ‚Äď oavsett var dess kod kommer att k√∂ras. Detta str√§cker sig till applikationer som k√∂rs inom den virtuella Java-maskinen (JVM), som kan k√∂ras oavsett det underliggande operativsystemet, f√∂rblir i stort sett systemagnostiska. Det √§r den valda plattformen f√∂r n√•gra av de mest anv√§nda verktygen inom big data-analys, som Apache Hadoop och Scala (mer om Scala nedan). Dess mogna maskininl√§rningsbibliotek, ramverk f√∂r stora data och inbyggda skalbarhet m√∂jligg√∂r √•tkomst till n√§stan obegr√§nsade m√§ngder lagring samtidigt som de hanterar m√•nga databearbetningsuppgifter i klustrade system.

SER: Javas 25-årsdag föranleder en titt på vilka tekniska produkter som har överlevt sedan 1995 (TechRepublic)

Julia

J√§mf√∂rt med de andra programmeringsspr√•ken p√• den h√§r listan √§r Julia det senaste spr√•ket med mindre √§n 10 √•r sedan det f√∂rsta sl√§ppet. Men du skulle missta dig om du blandar ihop det med bristande mognad, f√∂r trots att Julia √§r bland nyare spr√•k, v√§xer Julia stadigt i popularitet bland datavetare som kr√§ver ett dynamiskt spr√•k som kan utf√∂ra numerisk analys i en h√∂gpresterande datormilj√∂. Delvis tack vare dess snabbare exekveringstider ger den inte bara snabbare utveckling utan producerar applikationer som k√∂rs p√• liknande s√§tt som de som skapats p√• l√•gniv√•spr√•k, som till exempel C. En relativt liten nackdel med Julia √§r att gemenskapen inte √§r riktigt lika robust som den f√∂r andra spr√•k, vilket begr√§nsar supportalternativen ‚Äď men det √§r en del av v√§xtv√§rken f√∂r all nyare teknik som kommer att fungera av sig sj√§lv n√§r tekniken v√§xer.

SER: Julia vs Python: Det är därför det nya programmeringsspråket vinner nya fans (TechRepublic)

Scala

Scala är ett programmeringsspråk på hög nivå som är baserat på JVM-plattformen och designades för att dra fördel av många av samma fördelar som Java åtgärdar några av dess brister. Scala är tänkt att vara mycket skalbar och som sådan perfekt lämpad för att hantera komplexiteten hos big data. Detta inkluderar kompatibilitet med högpresterande datavetenskapsramverk baserade på Java, såsom Hadoop, till exempel. Det ger också ett flexibelt, mycket skalbart ramverk för klustrade datorer med öppen källkod när det paras ihop med Apache Spark och kan använda stora hårdvaruresurspooler effektivt.

SER: 10 plattformsoberoende kommandon som alla användare borde känna till (TechRepublic)

Botón volver arriba

Annonsblockerare upptäckt

Du måste ta bort AD BLOCKER för att fortsätta använda vår webbplats TACK