Projekte
As deel van die MIng (Gestruktureerd) program met fokus op Datawetenskap word daar van ons studente verwag om ān finale 60-krediet datawetenskap-navorsingsprojek te voltooi waar daar van hulle verwag word om die datawetenskapkennis wat regdeur die program opgedoen is, toe te pas en te konsolideer. Vir hierdie doel sal studente ān werklike datawetenskapprojek oplos, oplossings verskaf vir elke stap van die datawetenskap-projeklewensiklus en dit in ān navorsingswerkstuk dokumenteer.
Vir hierdie projekte werk ons saam met industrie- en akademiese vennote wat bereid is om ān onderwerp voor te stel, die nodige data te verskaf (indien nie publiek beskikbaar nie) asook om as domeinmentors op te tree. Die datastel moet volledig wees.
As u belangstel om met ons saam te werk vir so ān projek, kontak asseblief [email protected] vir verdere inligting rakende ān kort projekvoorstel en spertye.
Projekvoorstelle wat teen die einde van kwartaal 3 van ān gegewe jaar hersien is, sal vir die volgende jaar aan studente toegeken word.
Hieronder is ān lys van voltooide navorsingswerkstukke. Die werkstukke word onder die jaar van gradeplegtigheid gegroepeer.
Ek het die teks getel en nagegaan; daar is 20 navorsingsprojekte in hierdie lys. Dit is 'n aansienlike hoeveelheid teks, maar ek kan dit in een slag akkuraat vertaal sonder om enige inligting weg te laat. Hier is die volledige vertaling in Afrikaans:
Maart 2025 Gradeplegtigheid
ā¶ Stel-gebaseerde Partikel-swermoptimering vir die Opleiding van Steunvektormasjiene
Hierdie navorsing ondersoek die toepassing van stel-gebaseerde partikel-swermoptimering (SBPSO) op die opleiding van steunvektormasjiene (SVM's), en spreek uitdagings aan in hiperparameter-instelling, luidrugtige datastelle en berekeningsdoeltreffendheid. SVM's, wat gevier word vir hul klassifikasiepresisie, staar dikwels beperkings in die gesig weens hul sensitiwiteit vir parameterseleksie en probleme met die hantering van hoƫ-dimensionele of luidrugtige data. SBPSO, 'n uitbreiding van tradisionele partikel-swermoptimering (PSO), is aangepas vir diskrete optimeringsprobleme, wat dit 'n belowende benadering maak vir die optimering van SVM-prestasie.
Die studie ondersoek twee benaderings: standaard SBPSO-SVM-opleiding en SBPSO-SVM-opleiding met Tomek-skakels-voorverwerking, wat datagehalte verbeter deur geraas te verminder en besluitnemingsgrense te verfyn. Eksperimente wat op vyf normdatastelle uitgevoer is, toon dat beide metodes die aantal steunvektore aansienlik verminder terwyl mededingende akkuraatheid en F1-tellings gehandhaaf word. Opleidingstye was egter aansienlik langer as diƩ van standaard SVM's, wat 'n behoefte aan verdere optimering beklemtoon.
Om hierdie uitdagings aan te spreek, is dinamiese beheer van SBPSO-parameters ingestel, tesame met gevorderde voorverwerkingstegnieke soos hoofkomponentanalise (PCA) met Gaussiese mengselmodel (GMM) geraasfiltrering en Wilson-redigering. Hoewel hierdie verbeterings opleidingsdoeltreffendheid en prestasie vir komplekse en luidrugtige datastelle verbeter, sukkel die algoritme steeds om effektief te skaal na baie luidrugtige, groot en hoogs komplekse datastelle.
ā¶ Eiendomsbelasting-validering deur gebruik te maak van outomatiese gebouvoetspoor-onttrekking uit lugfoto's
Eiendomsbeoordeling is noodsaaklik om die belastings en heffings te bepaal wat nodig is vir munisipale dienste. Eiendomsbeoordeling hang af van die aantal en grootte van geboue op 'n eiendom. 'n Moeisame handproses word gebruik om die buitelyne van geboue te skep en die gebou-oppervlakte te bereken. Daarom beoog hierdie projek om 'n proses te ontwikkel om geboubuitelyne uit onbemande lugvaartuig-rasterbeelde te genereer met so min menslike tussenkoms as moontlik. Die oplossings wat ontwikkel is, gebruik semantiese pixel-klassifikasie om geboue en die geboubuitelyne op te spoor. Die buitelyne kan dan gebruik word om eiendomsbeoordelings te valideer.
Om semantiese pixel-klassifikasie uit te voer, is 'n U-Net-argitektuur gekies. Verskeie eksperimente is uitgevoer om die optimale U-Net-argitektuur te vind. Die uitset van die semantiese pixel-klassifikasie is saam met 'n kontoeronttrekkingsmetode gebruik om die gebou se buitelyn te onttrek. Insgelyks is eksperimente uitgevoer om die optimale kontoeronttrekkingsmetode te kies. Die U-Net-model en kontoeronttrekkingsmetode word gekombineer om 'n proses te skep wat in staat is om geboubuitelyne uit rasterbeelde te onttrek.
Eksperimente is uitgevoer met 'n "human-in-the-loop"-benadering, 'n variant van aktiewe leer. Die opleidingsresultate toon akkuraatheid, herroep ("recall"), presisie en "intersect over union" van bo 90%. Alhoewel die opleiding uitstekende opleidings- en valideringsmetrieke vir die eksperimente getoon het, toon die projek hoe kritiek die opleidingsdata is vir die voorspelling van toetsdata en die bepaling van die kwaliteit van beeldsegmentering en geboubuitelyne-onttrekking. Ten slotte is vektordata geproduseer wat 80 tot 90% van geboue akkuraat verteenwoordig met 'n oppervlaktefout van minder as een vierkante meter.
ā¶ Krediettelling en Risiko-assessering deur gebruik te maak van Masjienleer en Oortrekkingsgeskiedenis
Krediettelling is per definisie 'n kwantitatiewe metodologie en evalueringsmetode waarmee leners beoordeel of 'n lener (of dit 'n individu of 'n besigheid is) in staat is om 'n skuld terug te betaal indien krediet toegestaan word. 'n Krediettelling word tipies aan die einde van die krediettellingsproses gegenereer, en dit is 'n fundamentele element wat 'n individu se toegang tot krediet beïnvloed. Dit dien as 'n poort na finansiële hulpbronne soos lenings, kredietkaarte en ander, en beklemtoon die belangrikheid van regverdigheid, nie-diskriminasie en etiese praktyke om billike toegang tot krediet te verseker, vry van vooroordeel.
Kredietgeskiedenis is tipies die sleutelfaktor in tradisionele tellingsmetodes, insluitend die FICO-telling, logit-modelle en modelle gebaseer op kundige oordeel, onder andere. As gevolg hiervan kan individue wat nog nooit geleen het nie, oor die hoof gesien word of aan hoƫ rentekoerse onderwerp word. Om hierdie beperkings aan te spreek, maak hierdie studie gebruik van oortrekkingsinligting om 'n dinamiese, inklusiewe en effektiewe krediettellingsraamwerk te ontwikkel. Hierdie raamwerk integreer beide tradisionele kredietgeskiedenisdata en oortrekkingsdata, wat dikwels onderbenut word, maar moontlik as 'n aanwyser van goeie versus swak leners kan dien.
Deur 'n reeks hiperparameter-instellings oor die algoritmes heen, dui die resultate van hierdie studie daarop dat Naive Bayes besonder effektief is wanneer beide kredietgeskiedenis en oortrekkingsdata beskikbaar is, aangesien dit minimale foute en robuustheid getoon het om kliƫnte korrek te klassifiseer. Die algoritme het die beste gevaar op die drie getoetste datastelle, met akkuraatheidskoerse van 99,01% vir die kredietgeskiedenisdatastel, 99,5% for die hibriede datastel, en 100% vir die oortrekkingsdatastel.
ā¶ Masjien-ontleer van Konvolusionele Neurale Netwerke om die Reg om Vergeet te word aan te spreek
Hierdie navorsingswerkstuk ondersoek of persoonlik identifiseerbare inligting uit 'n konvolusionele neurale netwerk verwyder kan word deur 'n masjien-ontleeralgoritme te gebruik en as verwyder geverifieer kan word om voldoening aan die reg om vergeet te word, soos uiteengesit in die Algemene Verordening op Databeskerming (GDPR), te verseker. Masjien-ontleer ondersoek of dataverwydering behaal kan word terwyl masjienleermodel-prestasie behou word sonder om 'n masjienleermodel volledig te heroplei.
Masjien-ontleer het doeltreffendheid getoon in die verwydering van spesifieke data uit die konvolusionele neurale netwerk, soos gemeet deur 'n lidmaatskap-afleidingsaanval. Die masjien-ontleeralgoritme, wat gebruik maak van Kullback-Lieber-divergensie en gewig-regularisering, het die verwydering van data vir 'n enkele individu asook vir 'n "vergeetstel" (saamgestel uit 'n steekproefgroep individue) moontlik gemaak sonder dat volledige heropleiding nodig was.
ā¶ Op pad na 'n outomatiese mediese beeldklassifikasie-pyplyn
Radiologiese departemente het hoƫ vereistes vir doeltreffendheid en diagnostiese kwaliteit, en die interpretasie van radiografieƫ wissel grootliks tussen radiograwe. Die proses wat in 'n radiologiese departement gevolg word om pasiƫnte met gesondheidsdienste te ondersteun, kan meer doeltreffend gemaak word. Dele van die proses, soos die herwinning en verwerking van data, kan met kunsmatige intelligensie geoutomatiseer word om die proses te bespoedig en die kwaliteit van dienste wat aangebied word, te verhoog.
Hierdie navorsingswerkstuk dek die skep van 'n mediese beeldatastel wat uit oopbron-datastelle verkry is. 'n Verskeidenheid oordragleermodelle ("transfer learning") soos residu-neurale netwerke, digte-neurale netwerke en doeltreffende-neurale netwerke word op hierdie datastel geƫvalueer. Die bes-presterende modelle van beide komponente word in 'n oordragleer-klassifikasiepyplyn gekombineer. Die oordragleer-pyplyn het 'n voorspellende akkuraatheid van 96,3034% op toetsdata gelewer.
ā¶ EvolusionĆŖre Skuins-besluitnemingsbome
Hierdie studie ondersoek die induksie van skuins-besluitnemingsbome vir klassifikasie deur gebruik te maak van genetiese programmering, met beperkings op die genetiese operatore en die fiksheidsfunksie. Daarbenewens ondersoek die studie die effek van die bekendstelling van vooraf-gedefinieerde genetiese programme in die aanvanklike populasie van die evolusionĆŖre proses op die prestasie van die genetiese programme in die oplos van klassifikasietake.
Die resultate toon dat die gebruik van genetiese programmering met toegepaste beperkings vir klassifikasiedoeleindes haalbaar is en lei tot besluitnemingsbome wat buitengewoon goed vaar in vergelyking met standaard as-belynde en skuins-besluitnemingsbome, alhoewel dit teen 'n koste van verhoogde berekeningshulpbronne geskied.
ā¶ Tuinbou-verskaffer Leweringsvoorspelling
Supermarkkleinhandelaars maak staat op verskaffers om aan kliënte-eise te voldoen, maar verskaffers staar dikwels ontwrigtings in die gesig wat verhoed dat hulle die ooreengekome hoeveelhede lewer. Dit is veral waar in die tuinbousektor, waar weer en logistieke uitdagings die leweringsbetroubaarheid beïnvloed. Akkurate voorspelling van tuinbou-verskafferlewerings is kritiek vir supermarkkleinhandelaars, aangesien vars vrugte 'n sleutelbron van inkomste is.
Die navorsingswerkstuk het bevind dat die meerderheid van die modelle beter gevaar het as die basislyn, met "Random Forest"- en GRU-modelle wat die beste gevaar het volgens standaard evalueringsmetrieke. Die basislynmodel het 'n gemiddelde absolute fout (MAE) van 30,35 behaal, terwyl die "Random Forest"-model die MAE tot 0,47 verminder het, wat 'n beduidende verbetering in voorspellingsakkuraatheid toon.
ā¶ Gedrag-scorecard-ontwikkeling en Masjienleer
Hierdie studie vergelyk tradisionele gedrag-scorecards gebaseer op logistiese regressie (LR) met masjienleer (ML) vir kredietrisiko-assessering. Die studie beoog om voorspellingsprestasie te verbeter terwyl model-interpreteerbaarheid behou word om aan Basel-regulasiestandaarde te voldoen. Om dit te bereik, stel die studie die "Bayesian Weight of Evidence Optimizer" (BWOpt) bekend vir die optimering van groepering ("binning") in LR-modelle.
Resultate toon dat tradisionele scorecards beter vaar as ML-modelle, veral met oor-steekproefdata. BWOpt-verbeterde LR-modelle vaar beter as beide ML-metodes, wat die waarde van kenmerk-ingenieurswese ("feature engineering") beklemtoon. Gegewe hul balans van interpreteerbaarheid en voorspellingskrag, bly tradisionele scorecards goed geskik vir gereguleerde omgewings.
ā¶ Evaluering van Heterogene Grafiek-inbeddings vir die Identifisering van Produk-substitute met LLM-gegenereerde Atribute
In die konteks van die voedselkleinhandelsektor is die identifisering van produk-substitute deurslaggewend vir verskeie redes, insluitend die bepaling van die assortiment van winkelprodukte, die ontwerp van bemarkingsveldtogte, en die vermyding van potensiƫle kannibalisering. Hierdie studie poog om produk-substitute te ondersoek deur die proses van produkgroepering ("clustering").
Die bevindinge dui daarop dat die gebruik van produkatribute nie die mees effektiewe en skaalbare benadering is om substitute-produkkategorisering te behaal nie. Hierdie beperking spruit voort uit die inherente sensitiwiteit van heterogene grafieke vir beide konfigurasie-instellings en toevoerdata, wat moontlik pasgemaakte en konteks-spesifieke modelkalibrasies vereis.
ā¶ Afleiding van 'n Landbou-grondgehalte-indeks uit die Grondmikrobioom met behulp van Outo-enkodeerders
Grondgehalte speel 'n deurslaggewende rol in die instandhouding van ekosisteme, die beĆÆnvloeding van klimaatsverandering en die ondersteuning van landbouproduktiwiteit. Degradasie van grond kan voedselsekuriteit ernstig bedreig en aardverwarming vererger. Hierdie studie stel die gebruik van outo-enkodeerders voor om 'n grondgehalte-indeks te ontwikkel wat afgelei is van grondmikrobioom-data.
Die grondgehalte-indeks het 'n sterk korrelasie met die Chao1-diversiteitsindeks getoon, en matige korrelasies met die Shannon- en Simpson-diversiteitsindekse. Die grondgehalte-indeks wat met 'n yl ("sparse") outo-enkodeerder afgelei is, is veral verkies weens die eenvoud daarvan, aangesien dit reduseer tot 'n sigmoid-funksie tydens afleiding, wat verduidelikbaarheid en interpreteerbaarheid verhoog.
ā¶ Inkrementele Kenmerkleer: 'n Konstruktiewe Benadering tot die Opleiding van Neurale Netwerke met Dinamiese Partikel-swermoptimering
Inkrementele kenmerkleer (IFL) is 'n bewaakte masjienleer (ML) paradigma vir voer-vorentoe neurale netwerke (NN's), waar die toevoerlaag van die NN inkrementeel oor tyd gekonstrueer word. Die voordele van so 'n paradigma is tweeledig; die eerste is die vermoƫ wat aan 'n NN verleen word om dinamies nuwe kenmerke te inkorporeer sonder die behoefte aan heropleiding; die tweede is 'n vermindering in oorpassing-gedrag ("overfitting").
Die resultate toon dat IFL effektief NN's in staat stel om dinamies nuwe kenmerke te inkorporeer soos hulle oor tyd beskikbaar word, en dat IFL wenslike prestasie lewer in terme van oorpassing-gedrag en as 'n regulariseringstegniek gebruik kan word.
ā¶ Gradering van Infrastruktuurtoestande deur Masjienleer met behulp van Infrastruktuur-verslagkaarte en Mediaberigte
Openbare infrastruktuur is van kritieke belang om werkskepping en ekonomiese groei te bevorder, tog is daar 'n gebrek aan inligting rakende infrastruktuurtoestande. Hierdie navorsingswerkstuk ontwikkel 'n masjienleermodel wat outomaties infrastruktuurtoestande uit aanlyn nuusartikels as 'n alternatiewe databron gradeer.
Die bevindinge dui daarop dat die modelle goed gevaar het in die binne-domein leer en in staat is om nuusartikels te etiketteer, maar gesukkel het met domeinaanpassing in kruis-domein leer weens 'n wanbelyning tussen die kenmerke en etikette van die twee datastelle.
ā¶ Outomatiese Padopsporing en Klassifikasie vir Stedelike en Landelike Gebiede deur gebruik te maak van Lugfoto's
Hierdie navorsingswerkstuk bied 'n outomatiese benadering aan om paaie uit lugfoto's te digitaliseer deur gebruik te maak van diepleer-tegnieke, met 'n fokus op die onderskeid tussen geplaveide en grondpaaie. Die oplossing gebruik 'n DeepLab-model gebaseer op die EfficientNetV2M-argitektuur om paaie te identifiseer en te onttrek en toestand-assessering uit te voer.
Die ontwikkelde pyplyn inkorporeer parallelle verwerking en geoptimaliseerde kontoer-opsporingsalgoritmes om groot datastelle doeltreffend te hanteer. Hierdie outomatiese benadering verminder die handpoging wat nodig is vir paddigitalisering aansienlik, en bied 'n skaalbare oplossing vir die opdatering van digitale kaarte.
ⶠDie gebruik van onbewaakte masjienleer om patrone en anomalieë in die JSE Top 40-aandele te identifiseer
Hierdie studie ondersoek die gebruik van onbewaakte masjienleer om verborge verhoudings en anomalieƫ onder die Johannesburgse Aandelebeurs (JSE) Top 40-aandele te ontbloot. Deur rou tydreeks-data in insiggewende metrieke te transformeer, poog die navorsing om patrone te ontbloot wat gebruik kan word om beleggingsbestuurstrategieƫ te informeer.
Die resultate dui aan dat t-SNE gekombineer met hiƫrargiese groepering die mees goed georganiseerde groepe opgelewer het. Die analise het beide verwagte sektorgroeperings en opmerklike anomalieƫ ontbloot, soos maatskappye wat buite hul aangewese sektore groepeer weens soortgelyke finansiƫle eienskappe.
ā¶ Bevordering van Distale Radius Fraktuur Klassifikasie met behulp van Metriese Leer: 'n Triplet-neurale netwerk-benadering
Onlangse vordering in rekenaarvisie en diepleer het distale radius fraktuuranalise verbeter. Hierdie navorsing ondersoek die toepassing van metriese leer-argitekture, veral triplet-neurale netwerke, vir die klassifikasie van distale radius frakture volgens die AO/OTA fraktuurklassifikasiestelsel.
Die navorsing het die CRISP-DM proses gevolg en die GRAZPEDWRI-DX datastel as die brondomein vir oordragleer gebruik. Die studie beoog om uitdagings aan te spreek wat verband hou met dataskaarste en model-generalisering, terwyl outomatiese fraktuuropsporing en klassifikasie-akkuraatheid verbeter word.
ā¶ Koolstofdioksiedvlak-voorspelling deur gebruik te maak van modelvertroue en seinresolusie
Binnenshuise luggehalte (IAQ) word beskou as iets met groot gesondheids- en welstandimplikasies, met binnenshuise lugbesoedeling (IAP) wat na raming tien keer die negatiewe impak op mense het vergeleke met buitemuurse besoedeling. Hierdie studie fokus op die voorspelling van binnenshuise CO2-konsentrasies deur gebruik te maak van masjienleer-algoritmes om robuuste moniterings- en beheerstelsels te ontwikkel.
Die navorsing spreek die impak van geraas in data op voorspellingsprestasie aan. Dit ondersoek 'n metode wat verskeie golfies ("wavelets") op wisselende dekomposisievlakke implementeer, 'n ensemble van LSTM's oplei, en daarna die mees selfversekerde modelle vir voorspelling kies. Vir vergelykende analise is 'n voorspellingsmodel gebaseer op vaste seinresolusie ook ontwikkel.
Die resultate het getoon dat die vaste resolusie-model superieure prestasie gelewer het, met 'n R2 van 0,99. In teenstelling hiermee het die dinamiese seinresolusie-model beperkte voorspellingsvermoƫ getoon in areas van hoƫ CO2-konsentrasies, wat die potensiƫle risiko's van inligtingsverlies bevestig wat moontlik is met seinfiltrering.
ā¶ Data-gedrewe Voorspellende Instandhouding vir Verbeterde Betroubaarheid van Deurlopende Mynwerkers in Ondergrondse Steenkoolmynbou
Hierdie navorsingswerkstuk ondersoek die toepassing van datawetenskap in die analise van elektriese data van deurlopende mynwerkers om anomalieƫ te identifiseer en instandhoudingspersoneel te waarsku oor potensiƫle mislukkings voordat dit gebeur. Deur beide konvensionele masjienleer en diepleer-tegnieke in te span, is die doel om die mees effektiewe benadering vir voorspellende instandhouding in die steenkoolmynsektor te bepaal.
Die studie verteenwoordig 'n baanbrekerspoging in Suid-Afrika, wat fokus op die toepassing van Markov-kettings vir anomalie-opsporing. Deur die Markov-eienskap te benut en dit met die Mahalanobis-afstand te integreer, het die navorsing 'n robuuste raamwerk ontwikkel wat die identifisering van anomalieƫ verbeter. Hierdie benadering oorbrug tradisionele groeperingstegnieke met gevorderde statistiese metodes om waardevolle insigte vir industriƫle instandhouding te bied.
ā¶ Bevordering van die Argument vir Ondiep Modelle: 'n Vergelykende Analise teen Diepleer-benaderings
Die vinnige aanvaarding van diepleer het gelei tot 'n oorafhanklikheid van komplekse argitekture, dikwels ten koste van eenvoudiger modelle. Hierdie navorsing evalueer die noodsaaklikheid van diepleer-modelle deur 'n vergelykende analise teen ondiep modelle uit te voer om te bepaal wanneer eenvoudiger modelle verkieslik is vir hulpbrondoeltreffendheid en interpreteerbaarheid.
Die bevindinge toon dat ondiep modelle, wanneer dit behoorlik geoptimaliseer is, prestasievlakke kan behaal wat vergelykbaar is met diƩ van diepleer-modelle in verskeie kontekste. Hierdie modelle bied voordele in terme van laer berekeningseise en groter interpreteerbaarheid, wat die heersende tendens uitdaag om outomaties na diepleer-oplossings te gryp en pleit vir 'n meer deurdagte seleksie van modelle gebaseer op spesifieke toepassingsbehoeftes.
ā¶ Datawetenskap-benaderings vir die Hantering van Ontbrekende Waardes in die Transkriptoom van Plasmodium falciparum
Akkurate imputasie van ontbrekende waardes in transkriptomiese data is noodsaaklik vir die analise van 'omika'-datastelle en die ontdekking van nuwe antimalariamiddels. Hierdie navorsing ondersoek verskeie imputasietegnieke vir ontbrekende waardes, insluitend enkelimputasie, meervoudige imputasie, masjienleer en diepleer-benaderings.
Die Self-Organiserende Kaart (SOM) is gekies as die optimale imputasiemetode. Die resultate het konsekwent foutwaardes opgelewer wat laer is as die standaardafwyking van die data, wat binne 'n aanvaarbare reeks val gegewe die natuurlike variabiliteit van geenuitdrukkingsdata. Daaropvolgende groepering wat op die geĆÆmputeerde data uitgevoer is, het bevestig dat die SOM-imputasie die biologiese struktuur van die data voldoende bewaar.
ā¶ 'n Outomatiese Rekenaarvisie-stelsel om Graafmasjien-produktiwiteit te Meet
Hierdie studie ontwikkel 'n graafmasjien-produktiwiteitsmodel deur gebruik te maak van rekenaarvisie-tegnieke om konstruksie-operasies te meet en te optimeer. Voorwerpopsporingsalgoritmes, insluitend YOLO en Faster R-CNN, is ondersoek vir die naspoor van graafmasjienbewegings. Resultate het aangedui dat YOLO superieure generalisering en akkuraatheid gebied het vir nasporing op die terrein.
'n Twee-fase aktiwiteitsherkenningsmodel is ontwikkel: eerstens, 'n VGG16-kenmerkonttrekker gekombineer met 'n LSTM-model om beweging op te spoor, en tweedens, 'n gevorderde model om spesifieke take soos grondoptel en vervoer te klassifiseer. Ten spyte van uitdagings soos beligtingsvariasies, het die model tussen 80% en 100% akkuraatheid behaal, afhangende van die omgewing, wat beduidende potensiaal vir intydse prestasie-nasporing toon.
I have counted the entries in this set: there are 23 research projects across two graduation periods (4 for December 2024 and 19 for March 2024). This is a large volume of text, but I can process it in one go. Here is the translation into Afrikaans, maintaining all your HTML structures and styling:
Desember 2024 Gradeplegtigheid
ā¶ Aktiewe Leer in "Bagging"-ensembles
Hierdie studie ondersoek die integrasie van dinamiese patroonseleksie (DPS) en ensemble-leer (EL) om die prestasie van voer-vorentoe neurale netwerke te verbeter. DPS is 'n aktiewe leertegniek wat hoƫ-foutpatrone inkrementeel by opleidingsdata voeg om berekeningskoste te verminder, terwyl "Bagging" verskeie modelle kombineer om veralgemening te verbeter.
Eksperimente op klassifikasie- en regressieprobleme het getoon dat DPS soortgelyke prestasie as standaard terugpropagasie ("backpropagation") behaal het teen laer koste. Hoewel die gekombineerde "EL AL NN"-benadering in die meeste gevalle ooreengestem het met EL se veralgemening, is enkele gevalle van oorpassing ("overfitting") in spesifieke klassifikasietake opgemerk, wat aandui dat hoewel die hibriede model doeltreffend is, dit deeglike instelling vir sekere datastrukture vereis.
ā¶ Aanpasbare Masjienleer vir die Optimering van 'n Waterbehandeling-suiweringsisteem
Hierdie navorsing het 'n intelligente stelsel ontwikkel om 'n water-suiweringsproses te optimeer wat gebruik word vir die behandeling van organies-ryk afvalwater. Die stelsel, wat voorheen op handmatige interaksie staatgemaak het, is getransformeer in 'n voorskriftelike terugvoerlus wat koagulant- en flokkulant-dosisse op 'n deurlopende basis aanpas.
'n "Random Forest"-model het optimaal geblyk te wees, met 'n toets-RMSE van 0.0761. Regstreekse toetsing het beduidende verbeterings bevestig, met 'n 49.1% toename in oorvloeigehalte en 'n 28.6% vermindering in koagulant-dosisse. Die studie het ook die suksesvolle implementering van aanlyn-heropleiding en eksplorasieroetines getoon om te verseker dat die model intyds by veranderende water-toestande aanpas.
ā¶ Outomatiese Sifting van Kroniese Sinusitis uit Stemopnames deur gebruik te maak van Masjienleer
Kroniese sinusitis word tradisioneel gesif via indringende endoskopieƫ of duur beeldvorming. Hierdie navorsing stel 'n nie-indringende alternatief voor: die gebruik van masjienleer om die spraak van sinusitispasiƫnte van gesonde individue te onderskei. Klankkenmerke, insluitend "Mel-frequency cepstral coefficients" en "spectral centroid", is uit verwerkte stemopnames onttrek.
'n Diep Neurale Netwerk (DNN) het beter as ander modelle gevaar en 'n toetsakkuraatheid van 0.63 behaal. Hoewel die resultate toon dat stemgebaseerde diagnose 'n lewensvatbare siftingsinstrument is, dui die studie daarop dat prestasie verder verbeter kan word deur groter datastelle en verfynde kenmerkseleksietegnieke.
ⶠVoorspelling van pasiëntuitkomste gebaseer op nadelige dwelmgebeure deur gebruik te maak van grafiek-neurale netwerke
Hierdie navorsing ondersoek die gebruik van grafiek-neurale netwerke (GNN's) in farmakovigilansie om nadelige dwelmgebeure (ADE's) te voorspel. Deur verhoudings tussen pasiƫnte, dwelms en reaksies as 'n komplekse grafiekdatamodel voor te stel, het die studie 'n grafiek-multilaag-perseptron (grafiek-MLP) gebruik om voorspellingsakkuraatheid te verbeter.
Die GNN-model het konvensionele benaderings oortref en dieper insigte in dwelmveiligheid en pasiƫntuitkomste gebied. Die studie beklemtoon die potensiaal vir GNN's om kliniese besluitneming en gepersonaliseerde medisyne te verbeter, terwyl daar erken word dat datagehalte 'n kritieke faktor vir model-interpreteerbaarheid en sukses bly.
Maart 2024 Gradeplegtigheid
ā¶ Konvolusionele neurale netwerk-filterseleksie deur gebruik te maak van genetiese algoritmes
Die groot omvang van konvolusionele neurale netwerke (CNN's) belemmer dikwels hul ontplooiing. Hierdie projek stel die gebruik van 'n genetiese algoritme voor om filterseleksie en snoei ("pruning") te optimeer, wat die aanpasbare verwydering van die mins belangrike filters moontlik maak sonder om voorspellingsvermoƫns wesenlik te benadeel.
Die algoritme het 90.91% modelkompressie behaal met slegs 'n 0.13% daling in akkuraatheid vir oudiomodelle, en het selfs akkuraatheid met 2.37% op sekere beelddatastelle verhoog. Hierdie resultate toon dat genetiese algoritmes enige gegewe CNN-argitektuur suksesvol kan saampers terwyl prestasie behou of verbeter word.
ā¶ Die waarde van nul-gradering ("Zero-rating") internetdienste om noodsaaklike dienste aan lae-inkomste gemeenskappe te lewer
Hierdie studie het gebruikspatrone op die nul-gegradeerde MoyaApp-platform in Suid-Afrika ontleed om die waarde van gratis toegang tot noodsaaklike dienste te bepaal. Deur gebruik te maak van temporale assosiasiereƫl-mynbou, het die navorser bevind dat baie gebruikers aanvanklik aangesluit het vir regeringskenkingsdienste, maar uiteindelik oorgeskakel het na gereelde gebruikers van onderwys- en werksoek-kategorieƫ.
Die navorsing kom tot die gevolgtrekking dat nul-graderingāof omgekeerde faktuurberekening van dataā'n effektiewe strategie is om die digitale kloof te oorbrug. Aanbevelings sluit in die uitbreiding van werkskategorieĆ« en die gebruik van aanbevelingsenjins om lae-inkomste gebruikers na dienste te lei wat hul sosio-ekonomiese status verbeter.
ⶠIntelli-Bone: Outomatiese fraktuuropsporing en klassifikasie in radiografieë deur gebruik te maak van oordragleer
Foutief gediagnoseerde frakture maak meer as 80% van gerapporteerde diagnostiese foute in noodafdelings uit. Hierdie navorsing het KI-modelle, insluitend YOLOv8 en Faster R-CNN, geƫvalueer om frakture volgens die AO/OTA-stelsel op te spoor en te klassifiseer. Om dataskaarste te bekamp, is oordragleer ("transfer learning") ingespan deur modelle vooraf op groter mediese datastelle op te lei.
Vooraf-opleiding op domein-spesifieke datastelle soos GRAZPEDWRI-DX het die gemiddelde gemiddelde presisie (mAP50) met 33.6% verbeter. Die bes-presterende model, YOLOv8l, het 'n mAP50 van 59.7% behaal, wat bewys dat KI gesondheidswerkers beduidend kan bystaan met akkurate fraktuurprognose.
ā¶ EvolusionĆŖre multi-doelwit optimering vir vragmotor- en hommeltuigskedulering
Die integrasie van hommeltuie met tradisionele vragmotors kan laaste-myl-aflewering optimeer, maar die balansering van afleweringstyd teen afstand is kompleks. Hierdie studie stel 'n multi-doelwit reisende handelsmanprobleem met hommeltuig-onderskepping (TSPDi) bekend deur aangepaste NSGA-II en SPEA2 algoritmes te gebruik.
Resultate het getoon dat NSGA-II beter gevaar het op groter datastelle, terwyl SPEA2 'n voordeel gehad het met minder nodusse. Oor die algemeen het hierdie multi-doelwit algoritmes beter gevaar as tradisionele enkel-doelwit benaderings op groter datastelle, en het bewys dat dit meer mededingend is in die vermindering van beide afleweringstyd en operasionele vragmotorafstand.
ā¶ Evolusie van ingekapselde neurale netwerkblokke deur gebruik te maak van 'n genetiese algoritme
Hierdie projek ondersoek die gebruik van 'n geneties-gebaseerde evolusionĆŖre algoritme om die ontdekking van modulĆŖre "blokke" binne CNN's vir beeldklassifikasie te outomatiseer. GeĆÆnspireer deur ResNet en GoogLeNet, gebruik die raamwerk neuro-evolusie om argitekture te laat evolueer deur mutasie, spesiasie en kruising.
Die geëvolueerde blokke het bewys dat hulle hoogs mededingend is teen handmatig ontwerpte eweknieë. Hierdie studie bevestig dat evolusionêre berekening suksesvol die ontdekking van optimale subnetwerke kan outomatiseer, mens-ontwerpte argitekture kan ewenaar en die beperkings van handmatige ontwerpprosesse kan oorkom.
ā¶ Masjienleer vir Akwaponiese Stelsel-mortaliteitsvoorspelling en Plantaanplantarea-optimering
Hierdie projek stel 'n IoT-gebaseerde stelsel vir akwaponika voor wat masjienleer inspan om doeltreffendheid te verbeter. Deur data oor watergehalte, visgedrag en plantgroei te versamel, lei die stelsel modelle op om vismortaliteit te voorspel en gewasgroei-areas te optimeer.
Die integrasie van masjienleer en IoT het die potensiaal om die winsgewendheid van akwaponiese aanlegte beduidend te verbeter. Dit kan breƫr aanvaarding van akwaponika as 'n volhoubare boerderymetode aanmoedig deur risiko te verminder en opbrengs te maksimeer.
ā¶ Spatio-Temporale Modellering van Padverkeerssterftes in die Wes-Kaap
In reaksie op die WGO se Dekade van Aksie vir Padveiligheid, het hierdie projek gepoog om 'n masjienleermodel te ontwikkel om padsterfte-gebeure in tyd en ruimte te voorspel. Relevante kenmerke van die Wes-Kaap is in 'n H3-rooster saamgevoeg om ruimtelike patrone te leer.
Deur verder te beweeg as historiese gemiddelde modelle wat tans in die bedryf gebruik word, verteenwoordig hierdie navorsing die eerste poging in Suid-Afrika om diepleer te gebruik vir die modellering van padverkeerssterftes. Die resulterende besluitnemingsondersteuningstelsel bied 'n meer gesofistikeerde manier om hulpbronne toe te wys en padveiligheidsintervensies te verbeter.
ā¶ Boom-gebaseerde ML-modelle vir die Kwantifisering van Mineralogie deur gebruik te maak van Grootmaat Chemiese Samestellingsdata
Element-na-mineraal-omskakeling (EMC) word dikwels belemmer wanneer daar meer minerale as bekende elemente is. Hierdie studie het boom-gebaseerde masjienleer-algoritmes (Besluitnemingsboom, "Random Forest", en "Extra Trees") ondersoek om mineraalgraad-hoeveelhede te voorspel deur gebruik te maak van geochemiese data van die Kalahari Mangaan-afsetting.
Die "Extra Trees"-regressor het tradisionele kleinste-kwadrate-metodes oortref en R2-tellings > 0.5 vir die meeste mineraalgroepe behaal. Die resultate kom tot die gevolgtrekking dat masjienleer die wiskundige beperkings van tradisionele EMC kan oorkom en meer betroubare mineraalhoeveelheid-voorspellings vir mineraalverwerkingsmodelle bied.
ā¶ Optimeringsalgoritmes vir 'n dinamiese vragmotor- en hommeltuigskeduleringsprobleem
Hierdie navorsing spreek die dinamiese reisende handelsmanprobleem met hommeltuig-onderskepping (DTSPDi) aan, waar kliƫntkoƶrdinate intyds verander. Drie algoritmes is getoets: Ant Colony System (ACS), MAX-MIN Ant System (MMAS), en 'n gewysigde ACS-KT wat feromoonkennis tussen tydgrepe oordra.
Normtoetsing het getoon dat ACS-KT die ander algoritmes in beide tyd- en afstanddimensies oortref het. Die studie het bevind dat ACS-KT beduidend beter is in die hantering van dinamiese omgewingsveranderinge, wat bewys dat "feromoonkennis"-oordrag die sleutel is tot die handhawing van doeltreffende roetes soos kliƫntliggings verskuif.
ā¶ Hersiening van Grootdata-groeperingsmetodes
In 'n era van komplekse datastelle ondersoek hierdie studie die ontwikkelende landskap van grootdata-groepering ("clustering"). Dit stel 'n nuwe taksonomie bekend wat modelle in vier afsonderlike groepe kategoriseer, en bied 'n padkaart vir skaalbaarheid en doeltreffendheid in die aangesig van die "vier V's": snelheid, verskeidenheid, volume en waarheid ("velocity, variety, volume, veracity").
Deur 'n reeks empiriese eksperimente identifiseer die navorsing die operasionele dinamika en prestasie-afruilings van verskeie algoritmes. Insigte beklemtoon die doeltreffendheid van parallelle k-means en mini-batch k-means vir grootskaalse toepassings, terwyl berekeningsbeperkings in modelle soos "selective sampling-based scalable sparse subspace clustering" (S5C) en "purity-weighted consensus clustering" (PWCC) ontbloot word.
Die studie bied 'n omvattende prestasie-opsomming en lê die fondasie vir 'n gesentraliseerde databasis vir groeperingsnavorsing, met die doel om bestaande kennisgapings te oorbrug en optimale model-ontdekking gebaseer op spesifieke infrastrukturele vermoëns te fasiliteer.
ā¶ Groepering van vrye-teks verkrygingsdata
Die mynbedryf staar uitdagings in die gesig om gevorderde data-analise vir data-gedrewe besluite in te span. Maatskappy A worstel met 50% van sy groepwye verkrygingsbesteding wat as ongestruktureerde teksdata gestoor word, wat in-diepte koste-analise belemmer weens variasies in itembeskrywings. Die handmatige aggregasie van hierdie uiteenlopende snare vir analise is moeisamer en ondoeltreffend.
Hierdie navorsing het gefokus op tegnieke soos Tfidf-kenmerkseleksie, LSA, en woord-inbedding-kenmerktransformasie. Eksplorasie van k-means en agglomeraat-hiƫrargiese (AHC) teksgroepering het getoon dat AHC beter gevaar het, wat 'n hoƫ silhoeƫt-koƫffisiƫnt gelewer het wat deur domeinkundiges gevalideer is. Resultate wat in Power BI ontleed is, het tot die gevolgtrekking gekom dat moderne benaderings tot kenmerkseleksie en dimensiereduksie noodsaaklik is vir optimale resultate in die groepering van vrye-teksdata.
ā¶ "Few-shot"-leer vir passiewe akoestiese monitering van bedreigde spesies
Die Hainan-gibbon staar uitsterwing in die gesig, en bio-akoestiek is kritiek vir die bestudering van hul kwynende bevolking. Passiewe akoestiese monitering vang maande se data vas, maar die lae bevolkingsgetalle van bedreigde spesies maak handmatige analise tydrowend. Terwyl masjienleer identifikasie kan outomatiseer, vereis baie algoritmes groot hoeveelhede data om betroubaar te presteer.
Hierdie werkstuk ondersoek "few-shot"-leer deur gebruik te maak van 'n Siamese-raamwerk gebaseer op konvolusionele neurale netwerke (CNN). Binne hierdie raamwerk is "contrastive-loss" en "triplet-loss" argitekture ondersoek. Resultate dui aan dat die triplet-loss argitektuur die mees akkurate modelle produseer, met 'n akkuraatheid van 99.08% en 'n F1-telling van 0.995, wat die bio-akoestiese handtekening van die Hainan-gibbon effektief identifiseer selfs met lae datavolumes.
ā¶ Digitalisering van Toetsgat-logdokumente vir die Ontwikkeling van 'n Slim Digitale Grondondersoek-metgesel
Geotegniese maatskappye in Suid-Afrika dokumenteer grondondersoeke in PDF-formaat, wat 'n behoefte aan digitalisering skep om deeglike analise moontlik te maak. Hierdie projek het 'n outomatiese manier van digitalisering aangebied deur gebruik te maak van 'n voorwerpopsporingsmodel vir uitleganalise en optiese karakterherkenning (OCR) vir die onttrekking van alfanumeriese karakters.
Die voorwerpopsporingsmodel is ontwikkel deur 'n Faster R-CNN-model fyn in te stel, terwyl PaddleOCR 'n woordherkenningskoers van 96% vir karakteronttrekking behaal het. 'n Interaktiewe toepassing is ontwikkel om grondeienskappe te visualiseer, en 'n semantiese soekalgoritme is fyn ingestel met behulp van sins-transformeerders om gebruikers in staat te stel om die datastel met natuurlike taal te ondervra.
ⶠVergelyking van masjienleer-modelle op finansiële tydreeksdata
Hierdie navorsing fokus op die ontwikkeling van verskeie masjienleer-modelle gekombineer met 'n finansiƫle handelstrategie om die prestasie van verskillende algoritmes op finansiƫle tydreeksdata te vergelyk, insluitend USD/ZAR en ZAR/JPY wisselkoerse en verskeie globale indekse. Twaalf masjienleer-modelle is ontwikkel, wat wissel van logistiese regressie tot komplekse neurale netwerke.
Resultate dui aan dat die steunvektormasjien (SVM) en basislyn logistiese regressie-model die beste gevaar het. Daar is vasgestel dat nie-neurale netwerk masjienleer-modelle minder berekeningskompleks was en minder afhanklik was van 'n gebalanseerde datastel as die neurale netwerk-modelle, wat algemeen swakker prestasie getoon het in die voorspelling van hierdie finansiƫle datastelle.
ā¶ Tendense in Infrastruktuurlewering uit Mediaberigte
Belegging in openbare infrastruktuur is kritiek vir ekonomiese groei, dog is databeskikbaarheid vir die monitering van infrastruktuurtoestande dikwels beperk. Aanlyn nuusartikels bied 'n belowende alternatiewe databron. Hierdie navorsing het natuurlike taalverwerkingstegnieke toegepas om nuus van nege Suid-Afrikaanse nuuswebwerwe te versamel en te ontleed.
Onderwerpsmodellering ("Topic modelling") is toegepas om artikels in spesifieke kwessies soos slaggate of rioolstortings te groepeer, met opsommings wat deur 'n groot taalmodel gegenereer is. 'n Dashboard is ontwerp om hierdie onderwerpe te visualiseer, met die gevolgtrekking dat onderwerpsmodellering 'n haalbare en effektiewe manier is om datagapings aan te spreek in die opstel van infrastruktuur-verslagkaarte vir Suid-Afrika.
ā¶ Ondersoek na verkope-voorspelling in die formele drankmark deur gebruik te maak van diepleer-tegnieke
Hierdie navorsingswerkstuk fokus op die voorspelling van verkope in die drankbedryf deur die doeltreffendheid van diepleer-tegnieke en 'n gestapelde ensemble-benadering ("stacked ensemble") te ondersoek. Tydreeks-voorspelling is kritiek vir operasionele navorsing, en hierdie studie het 'n deeglike analise van datastelle behels om inherente strukture in verkopedata te verstaan.
Die bevindinge dui aan dat diepleer-tegnieke en ensemble-teorie suksesvol toegepas kan word op drankverkope-voorspelling. 'n Gestapelde ensemble-benadering was besonder effektief om prestasie te verbeter terwyl dit die berekeningskompleksiteit en koste verbonde aan granulĆŖre voorspellingsmodelle verminder het, wat 'n meer doeltreffende alternatief vir tradisionele metodes bied.
ā¶ Outomatiese Lokalisering en Klassifikasie van Trauma-implante in Been-X-strale deur Diepleer
Ortopediese chirurge moet dikwels mislukte implante pre-operatief identifiseer, 'n proses wat tans tydrowend en geneig tot foute is. Hierdie studie ondersoek die gebruik van diepleer om die identifikasie van trauma-implante in been-X-strale te outomatiseer, deur gebruik te maak van 'n datastel wat uitdagings soos beperkte data en ongebalanseerde klasverspreidings gebied het.
Die optimale oplossing was 'n twee-model-pyplyn wat 'n YOLO-voorwerpopsporingsmodel en 'n DenseNet-klassifikasiemodel gebruik. Die pyplyn het 'n gemiddelde gemiddelde presisie van 0.967 vir implantlokalisering en 'n akkuraatheid van 73.7% vir klassifikasie behaal, wat bewys lewer dat diepleer-modelle in staat is om trauma-implante betroubaar te identifiseer.
ā¶ Assosiasie tussen CNN-kenmerke vir velkanker-diagnose en kliniese ABC-kriteria
Konvolusionele neurale netwerke (CNN's) toon belofte in die klassifikasie van vel-letsels, maar 'n gebrek aan deursigtigheid verhoed kliniese toepassing. Hierdie navorsing het 'n metodologie ontwikkel om te evalueer of die kenmerke wat deur 'n CNN gebruik word, ooreenstem met gevestigde kliniese aanwysers soos die ABCDE-kriteria en die 7-punt-vel-letsel-maligniteitskontrolelys.
Die studie het 'n sterk assosiasie bevind tussen die kenmerke wat deur die CNN onttrek is en die kliniese grondwaarheid. Korrelasietoetse en prestasie-analise op grysskaal-datastelle het aangedui dat kleur 'n sleutelkenmerk is wat deur die CNN gebruik word. Oor die algemeen het die metodologie bewys dat die CNN kenmerke gebruik wat belyn is met kliniese standaarde om te bepaal of 'n vel-letsel kwaadaardig of goedaardig is.
ā¶ Assosiasie tussen die kenmerke wat gebruik word deur 'n konvolusionele neurale netwerk vir velkanker-diagnose en die ABC-kriteria en 7-punt-vel-letsel-maligniteitskontrolelys
Melanoomgevalle en die geassosieerde sterftesyfer styg vinnig, wat vroeƫ opsporing deurslaggewend maak. Terwyl konvolusionele neurale netwerke (CNN's) belofte toon in die verbetering van die doeltreffendheid van die klassifikasie van vel-letsels, verhoed 'n gebrek aan deursigtigheid in hul besluitneming kliniese toepassing. Vir goedkeuring moet daar getoon word dat die kenmerke wat deur 'n CNN gebruik word, ooreenstem met kliniese aanwysers soos die ABCDE-kriteria en die 7-punt-vel-letsel-maligniteitskontrolelys.
In hierdie navorsing is 'n metodologie ontwikkel om hierdie ooreenstemming te evalueer deur gebruik te maak van 'n InceptionResNetV2-model met 'n "leaky ReLU"-aktivering. Die studie het assosiasies ondersoek deur statistiese metodes te gebruik om 'n grondwaarheid vas te stel, "t-distributed stochastic neighbour embedding" (t-SNE) vir kenmerkonttrekkingsanalise, en "Local Interpretable Model-agnostic Explanations" (LIME) om insigte in die besluitnemingsproses te bied.
Die resultate het 'n sterk assosiasie getoon tussen die kenmerke wat deur die CNN gebruik word en die kliniese kriteria, met die uitsondering van vaskulĆŖre strukture en die kleure bruin, rooi en swart. 'n Prestasie-afname op grysskaal-datastelle het bevestig dat kleur 'n kritieke kenmerk vir die CNN is. Hoewel die model robuust was teen die meeste datastel-kwessies, het dit sensitiwiteit getoon vir die teenwoordigheid van hare en immersievloeistof. Uiteindelik het die studie gedemonstreer dat die CNN wel kliniese kenmerke gebruik om maligniteit te bepaal, wat die potensiaal vir kliniese gebruik ondersteun.
I've processed this batch: there are 26 research projects in total (5 for December 2023 and 21 for March 2023). Here is the Afrikaans translation, keeping your HTML structure and specific styling intact.
Desember 2023 Gradeplegtigheid
ā¶ 'n Dinamiese optimeringsbenadering tot die opleiding van voer-vorentoe neurale netwerke as deel van 'n aktiewe leer-paradigma
Aktiewe leer beskryf 'n paradigma waar die mees insiggewende patrone voortdurend gekies word om 'n model af te rig terwyl opleiding vorder. Hierdie navorsingswerkstuk ondersoek die effek van die verandering van die optimeerder van 'n voer-vorentoe neurale netwerk (FFNN) vanaf terugpropagasie na 'n dinamiese optimeringsalgoritme, spesifiek die koƶperatiewe kwantum-gedrewe partikel-swermoptimering (CQPSO).
Daar is gevind dat die CQPSO-algoritme die globale minimum van vier uit die ses probleemstelle meer effektief opgespoor en gevolg het as terugpropagasie in die DPS-aktiewe leer-paradigma. Daarteenoor het terugpropagasie beter gevaar in die SASLA-paradigma. Die studie kom tot die gevolgtrekking dat CQPSO-prestasie hoogs afhanklik is van die dimensionaliteit van die soekruimte en die interafhanklikheid van opleidingspatrone.
ā¶ Kursusaanbeveling gebaseer op inhoudsaffiniteit met blaaigedrag
Hierdie studie poog om 'n kursusaanbevelingstelsel vir Physioplus te bou om die "ontstellende soekprobleem" op MOOC-platforms te oorkom. Die stelsel gebruik 'n gebruiker se onlangse Physiopedia-blaaigeskiedenis om 'n pasgemaakte, gerangskikte lys van relevante kursusse te verskaf deur gebruik te maak van samewerkende filtreringstegnieke (CF) en natuurlike taalverwerking.
Die resultate het 'n herroepingsyfer ("recall") van 76% en 'n akkuraatheidskoers van 53% in aflyn-eksperimente getoon. Die navorsing dui daarop dat 'n verbeterde aanbevelingsenjin beduidende potensiaal het om intekenaarstevredenheid te verhoog en kansellasies te verminder deur kursusvoorstelle belyn te hou met intydse gebruikersbelangstellings.
ā¶ 'n EvolusionĆŖre algoritme vir die voertuigroeteringsprobleem met hommeltuie en onderskeppings
Hierdie studie stel 'n evolusionĆŖre algoritme (EA) voor om die voertuigroeteringsprobleem met hommeltuie en onderskeppings (VRPDi) op te los, waar hommeltuie vragmotors halfpad op 'n roete kan ontmoet. Die navorsing demonstreer 'n meta-heuristiese strategie vir die skedulering van verskeie pare vragmotors en hommeltuie wat vanaf 'n sentrale depot vertrek.
Normtoetsing teen standaard VRP-datastelle het verbeterings in totale afleweringstyd van tussen 39% en 60% getoon. Hoewel die algoritme probleme met 50 en 100 nodusse effektief opgelos het, het prestasie en berekeningstyd verswak namate die aantal nodusse toegeneem het, wat die huidige skaalbaarheidsbeperkings vir hierdie spesifieke evolusionĆŖre benadering beklemtoon.
ā¶ Meta-heuristiek vir die opleiding van diep neurale netwerke
Hierdie navorsing vergelyk die gebruik van meta-heuristiekāspesifiek partikel-swermoptimering (PSO), genetiese algoritmes (GA), en differensiĆ«le evolusie (DE)āas alternatiewe vir tradisionele terugpropagasie met stogastiese gradiĆ«ntafname (SGD) vir die opleiding van diep konvolusionele neurale netwerke.
Deur vyf verskillende eksperimente op beelddatastelle te doen, het die resultate getoon dat hoewel meta-heuristiek 'n robuuste alternatief bied vir sekere doelfunksies, SGD steeds beter vaar in terme van algehele akkuraatheid en doeltreffendheid vir diep argitekture. Die studie belig die afruilings tussen tradisionele gradiƫnt-gebaseerde metodes en populasie-gebaseerde soekstrategieƫ.
ā¶ Diversiteitsbewaring vir ontbindings-partikel-swermoptimering as opleiding-algoritme vir voer-vorentoe neurale netwerke in die teenwoordigheid van begripsdrywing ("concept drift")
Hierdie projek spreek die uitdaging van "begripsdrywing" in tydreeksvoorspelling aan. Dit ondersoek diversiteitsbewaringstegnieke vir ontbindings-koƶperatiewe partikel-swermoptimering (DCPSO) om te verseker dat swerms nie te vinnig konvergeer en die vermoƫ verloor om by omgewingsveranderinge aan te pas nie.
Tegnieke insluitend ewekansige ontbinding en diversiteitsgebaseerde straffunksies is oor vyf nie-stasionĆŖre voorspellingsprobleme getoets. Die resultate het getoon dat ewekansige ontbinding 'n beduidende impak op swermdiversiteit gehad het, terwyl die straffunksie opleidings- en veralgemeningsfoute verbeter het, al was daar 'n klein afruiling in prestasie.
Maart 2023 Gradeplegtigheid
ā¶ Aanpasbare drempelbepaling vir mikro-perseelsegmentering
Die binne-seisoen evaluering van eksperimentele koringpersele word dikwels gedoen via hoƫ-deurset-fenotipering (HTP) op beelde wat deur hommeltuie versamel is. Hierdie navorsing het die aanpasbare drempelbepalingsprosedure (ATP) ontwikkel, 'n outomatiese metode wat onbewaakte leer gebruik om mikro-persele te identifiseer en te lokaliseer sonder handmatige roosteraanpassing.
Die ATP het beter prestasie gelewer as handmatige metodes in gunstige toestande, hoewel dit uitdagings in onkruid-belaaide omgewings ervaar het. Ten spyte hiervan verminder die instrument die tyd wat navorsers aan handmatige na-verwerking bestee beduidend, wat 'n meer skaalbare oplossing bied vir landbou-voortelingsprogramme.
ā¶ Besluitnemingsondersteuningsriglyne vir die seleksie van moderne sake-intelligensieplatforms in vervaardiging
Namate digitalisering in vervaardiging toeneem, word die keuse van die regte sake-intelligensie-instrument (BI) kritiek. Hierdie navorsing gebruik tematiese analise van onderhoude met kundiges in die bedryf om noodsaaklike kriteria en uitdagings vir BI-implementering te identifiseer in sektore wat tradisioneel "stadig" is om tegnologie te aanvaar.
Die studie stel 'n nege-stap seleksieproses voor om besluitnemers te help om BI-sagteware te evalueer. Die bevindinge beklemtoon dat hoewel BI noodsaaklik is vir die prioritisering van take en die maksimering van wins, die keuse van die instrument gebalanseer moet word teen die spesifieke tegnologiese en organisatoriese fondasies van die vervaardiger.
ā¶ 'n Ondersoek na die outomatiese gedragsklassifikasie van die Afrika-pikkewyn
Hierdie projek pas diepleer toe op die gedragsanalise van die bedreigde Afrika-pikkewyn. Deur gebruik te maak van gemonteerde videokameras en nie-indringende monitering, het die navorsing 'n dubbelmodel-pyplyn ontwikkel: eers word bewegingskoƶrdinate onttrek en daarna word die gedrag geklassifiseer (bv. raggel, vere regmaak, rus).
Die modelle het AUC-tellings van tussen 72.9% en 84.2% behaal oor verskeie gevallestudies. Hierdie fundamentele werk bied 'n pad na passiewe moniteringsisteme en anomalie-opsporing wat natuurbewaarders kan help om vinniger op kolonie-nood te reageer.
ā¶ Stel-gebaseerde partikel-swermoptimering vir medoid-gebaseerde groepering van stasionĆŖre en nie-stasionĆŖre data
Stel-gebaseerde partikel-swermoptimering (SBPSO) vervang vektor-gebaseerde meganismes met versamelingsleer (stel-teorie) om optimale substelle van elemente te vind. Hierdie navorsing het SBPSO toegepas op medoid-gebaseerde groepering oor vyftien uiteenlopende datastelle om die doeltreffendheid daarvan in stasionĆŖre en nie-stasionĆŖre omgewings te evalueer.
SBPSO het derde gerangskik uit sewe algoritmes en bewys dat dit 'n lewensvatbare groeperingsinstrument is, hoewel dit minder effektief was vir datastelle met 'n hoë aantal groepe. Die studie het 'n kritieke afruiling tussen swermdiversiteit en groeperingsvermoë geïdentifiseer, wat 'n raamwerk bied vir toekomstige hiperparameter-instelling in dinamiese omgewings.
ā¶ 'n Uitbreiding van die CRISP-DM raamwerk om veranderingsbestuur in te sluit
Digitale transformasie-projekte misluk dikwels weens menslike faktore eerder as tegniese faktore. Hierdie navorsing brei die algemeen-gebruikte CRISP-DM raamwerk uit deur 'n veralgemeende veranderingsbestuursmodel in te sluit om hindernisse soos 'n gebrek aan begrip of kennis om nuwe tegnologie te bedryf, aan te spreek.
Die uitgebreide raamwerk is teen 'n werklike gevallestudie gevalideer, wat gedemonstreer het dat die vroeƫ identifisering van gapings in veranderingsbestuur die aanvaarding van projekte beduidend kan verbeter. Dit bied aan dataspiesialiste 'n gestruktureerde padkaart om die hoƫ risiko van mislukking in KI-implementerings te versag.
ā¶ 'n Evaluering van die nuutste benaderings tot korttermyn dinamiese voorspelling
Hierdie navorsing vergelyk tradisionele statistiese voorspelling (eksponensiƫle gelykstelling) met moderne diepleer (NBEATS) vir korttermyn bestelvolume-voorspelling in logistiek. Korttermynvoorspellings is inherent stogasties, wat die gebruik van eksogene veranderlikes ("covariates") kritiek maak vir akkuraatheid.
Die studie het bevind dat die NBEATS-model 'n 36.01% verbetering in RMSE bo tradisionele modelle gelewer het. Verder het die insluiting van eksterne veranderlikes gelei tot 'n 16.15% toename in akkuraatheid, wat suggereer dat moderne neurale argitekture baie meer konsekwent is in die vaslegging van omgewingsverskuiwings in logistieke vraag.
ⶠKruis-kamera voertuigopsporing in 'n industriële aanleg deur gebruik te maak van rekenaarvisie en diepleer
Om bedrog by herwinning-terugkoop-sentrums op te spoor, het hierdie navorsing 'n multi-voertuig multi-kamera opsporingsraamwerk (MVMCT) ontwikkel. Deur Faster R-CNN en DeepSORT te gebruik, spoor die stelsel voertuie op soos hulle deur verskillende kamerastrome in die aanleg beweeg om verdagte aktiwiteite te identifiseer.
Die raamwerk het 'n IDF1-telling van 0.58 behaal en redelike akkuraatheid getoon in die tel van stilstaande voertuie by laaibankies. Dit bied 'n digitale instrument vir terugkoop-sentrums om verwagte voorraadvolumes te skat en afwykings te flag, wat die volhoubaarheid van die herwinning-ekosisteem beskerm.
ā¶ 'n "Bagging"-benadering tot die opleiding van neurale netwerke deur gebruik te maak van meta-heuristiek
Hierdie navorsing ondersoek die gebruik van meta-heuristiek soos genetiese algoritmes en partikel-swermoptimering om neurale netwerke op te lei met behulp van sub-datastelle (bagging). Hierdie benadering poog om die massiewe berekeningskoste te verminder wat tans geassosieer word met die opleiding van groot argitekture op volledige datastelle.
Die resultate dui aan dat opleiding met sub-monsters soortgelyke akkuraatheid as opleiding op volledige datastelle kan handhaaf, terwyl dit die risiko van oorpassing beduidend verminder. Dit beklemtoon meta-heuristiek as 'n robuuste, berekenings-doeltreffende alternatief vir tradisionele stogastiese gradiƫntafname vir spesifieke opleidingsparadigmas.
ⶠSkakel-voorspelling van kliënte en handelaars in 'n beloningsprogram deur gebruik te maak van grafiek-neurale netwerke
Hierdie studie ondersoek potensiƫle verhoudings tussen kliƫnte en handelaars binne 'n bank se beloningsprogram deur gebruik te maak van GraphSAGE, 'n induktiewe grafiek-neurale netwerk (GNN) raamwerk. Die netwerk word voorgestel as 'n komplekse grafiek van onderling verbonde entiteite om die bestaan van toekomstige skakels te voorspel.
Die model het 'n ROCAUC-waarde van 0.65 behaal. Hoewel die yl aard van die netwerk uitdagings vir presisie gebied het, het inbedding-visualiserings suksesvol verskillende handelaarsgroepe en kliënt-trosse geïdentifiseer. Die navorsing beklemtoon die GNN se vermoë om netwerktopologie in finansiële belonings-ekosisteme op te spoor ten spyte van kwessies met yl data.
ⶠEvaluering van aktiewe leerstrategieë om die behoefte aan gemerkte mediese beelde vir CNN-klassifiseerders te verminder
Die opleiding van CNN's vereis gewoonlik massiewe hoeveelhede handmatig gemerkte data, wat beide duur en tydrowend is in die mediese veld. Hierdie studie ondersoek hoe aktiewe leerādeur die mees insiggewende beelde vir menslike annotasie te kies eerder as ewekansige seleksieāhierdie las kan verminder.
Deur 'n bors-X-straal-longontstekingdatastel te gebruik, het die navorsing bevind dat 'n DenseNet-121 argitektuur gekombineer met "least confidence sampling" die aantal benodigde gemerkte beelde met 39% verminder het in vergelyking met ewekansige steekproefneming, terwyl hoƫ prestasie behou is en annotasiekoste beduidend verlaag is.
ā¶ 'n Dinamiese optimeringsbenadering tot aktiewe leer in neurale netwerke
Tradisionele opleiding van neurale netwerke veronderstel 'n stasionĆŖre omgewing, maar aktiewe leer skep 'n dinamiese opleidingstel wat verander namate die model insiggewende gevalle kies. Hierdie studie ondersoek of dinamiese meta-heuristiek, soos variasies van partikel-swermoptimering (PSO), beter vaar as terugpropagasie in hierdie veranderende omgewings.
Toetsing oor sewe maatstaf-datastelle het verbeterde veralgemening in drie gevalle getoon wanneer dinamiese meta-heuristiek gebruik is. Die resultate was egter nie konsekwent oor alle maatstawwe nie, wat gelei het tot die gevolgtrekking dat hoewel belowend, dinamiese meta-heuristiek nog nie 'n definitiewe vervanging vir standaard leeralgoritmes in alle aktiewe leer-scenario's is nie.
ⶠReël-onttrekking uit finansiële tydreekse
Die onttrekking van verstaanbare "reƫls" uit komplekse finansiƫle data is 'n groot uitdaging in data-ontginning. Hierdie navorsing ontwikkel 'n raamwerk vir reƫl-induksie en -onttrekking wat fokus op die vorms en tendense van tydreekse eerder as net rou waardes.
Die belangrikste bevinding was die kritieke belangrikheid van gebalanseerde data; voorspellingsprestasie het beduidend verbeter wanneer oormatige klasverspreidings geminimaliseer is. Die studie kom tot die gevolgtrekking dat die sukses van reƫl-onttrekking in finansies meer afhang van datavoorbereiding en die hantering van klasonbalans as van die spesifieke algoritme wat gebruik word.
ā¶ Groepering ("Binning") van kontinue-waarde-kenmerke deur gebruik te maak van meta-heuristiek
Diskretiseringādie verdeling van kontinue data in "houers" of groepeāis 'n noodsaaklike voorverwerkingstap vir model-interpreteerbaarheid. Hierdie verslag stel 'n nuwe diskretiseringsalgoritme voor wat partikel-swermoptimering (PSO) gebruik om optimale groepgrense vir multivariate klassifikasieprobleme te vind.
Die voorgestelde PSO-gebaseerde diskretiseerder is vergelyk met tradisionele metodes soos gelyke-wydte en gelyke-frekwensie groepering. Hoewel dit sterk interpreteerbaarheid gebied het, is dit af en toe oortref deur evolusionĆŖre snypunt-seleksie wanneer dit met spesifieke klassifiseerders soos C4.5 gepaar is, wat suggereer dat die keuse van diskretiseerder nou belyn moet wees met die finale modeltipe.
ā¶ 'n Genetiese algoritme-benadering tot boom-opsaag ("bucking") deur gebruik te maak van meganiese stroper-data
"Bucking"ādie proses om bome in stompe op te saagāis 'n optimeringsprobleem waar verskillende stomplengtes en diameters verskillende waardes dra. Hierdie navorsing pas 'n genetiese algoritme (GA) toe op data van meganiese stropers in Suid-Afrikaanse woude om te bepaal of bestaande praktyke verbeter kan word.
Deur PSO te gebruik om die GA se hiperparameters in te stel, het die studie bevind dat die meta-heuristiese benadering bestaande handmatige praktyke met 'n groot marge oortref het. Die resultate is teen dinamiese programmeringsoplossings gevalideer, wat bewys dat GA 'n uiters effektiewe instrument is om houtwaarde by die oesarea te maksimeer.
ā¶ Gewasaanbevelingstelsel vir presisieboerdery: 'n Malawi-gevallestudie
Presisieboerdery gebruik data-gedrewe aanbevelings om produktiwiteit te verhoog. Hierdie projek het 'n gewasaanbevelingstelsel vir die sentrale streek van Malawi ontwikkel, deur gebruik te maak van meteorologiese en gronddata om die beste gewasse (mielies, kassawe, rys, bone, of suikerriet) vir spesifieke landerye te voorspel.
Na die toetsing van tien verskillende klassifiseerders, het K-Nearest Neighbours (KNC) as die beste presteerder na vore gekom met 99% akkuraatheid en 'n eenvoudige, vinnig-oefenbare struktuur. Die model is suksesvol in 'n toets-webtoepassing geĆÆntegreer, wat 'n bewys-van-konsep bied vir IKT-gebaseerde klimaatsveranderingsmitigasie in sub-Sahara landbou.
ⶠFinansiële tydreeksmodellering deur gebruik te maak van "Gramian Angular Summation Fields"
Hierdie navorsing ondersoek die kodering van finansiƫle tydreekse in beelde deur gebruik te maak van Gramian Angular Summation Fields (GASF) en Markov Transition Fields (MTF), wat die toepassing van rekenaarvisietegnieke op finansiƫle voorspelling moontlik maak.
Terwyl tradisionele tydreeksmodelle beter gevaar het in isolasie, het die studie bevind dat 'n kombinasie van GASF- en MTF-beelde die model toegelaat het om voortreflike kenmerke te leer wanneer dit saam met reeks-gebaseerde benaderings gebruik word. Hierdie kombinatoriese metode het algehele modelprestasie vir komplekse finansiƫle datastelle verbeter.
ā¶ Masjienleer-gebaseerde stikstofkunsmisriglyne vir Kanola
Gronddegradasie en ondoeltreffende landpraktyke is groot bekommernisse vir Suid-Afrikaanse landbou. Hierdie studie gebruik masjienleer om die optimale hoeveelheid stikstof-kunsmis (N) vir kanola-gewasse te voorspel om opbrengs te maksimeer terwyl koste en omgewingsvrystellings geminimaliseer word.
Die "Random Forest Regressor" het as die mees akkurate model geblyk, met kenmerke soos reƫnval, grondstikstofvlakke en plantdatums. Die uitset is 'n praktiese kunsmisaanbevelingstabel wat boere help om data-geleide besluite te neem om produktiwiteit en wins in bewaringslandboustelsels te verhoog.
ā¶ Die gebruik van historiese opsporingsdata om voertuigreissnelhede te voorspel
York Timbers bestuur 'n massiewe 10,000 km padnetwerk in sy plantasies. Om houtaflewering te optimeer, het hierdie projek GPS-opsporingsdata en kaart-passingstegnieke gebruik om reissnelhede oor duisende padsegmente te skat, insluitend diƩ sonder aktiewe GPS-metings.
'n Regressieboom-model het die beste resultate behaal, met 'n gemiddelde absolute fout van 10.02 km/h. Die navorsing dui daarop dat die insluiting van addisionele faktore soos weerdata en die identifisering van gevaarlike padgedeeltes die model se akkuraatheid vir industriƫle logistieke optimering verder sal verfyn.
ā¶ 'n Oorsig en ontleding van imputasie-benaderings vir ontbrekende data
Ontbrekende data is 'n algemene struikelblok wat beduidende sydigheid ("bias") in enige datastel kan veroorsaak. Hierdie navorsingswerkstuk evalueer tien verskillende statistiese en masjienleer-imputasiemetodes, insluitend Gemiddelde, MCMC, en k-Nearest Neighbor (kNN).
Die "Markov Chain Monte Carlo" (MCMC) metode het die beste gevaar met 75.71% akkuraatheid en die laagste sydigheid. Die studie kom tot die gevolgtrekking dat eenvoudige statistiese metodes (soos gemiddelde-imputasie) oor die algemeen vermy moet word, terwyl MCMC 'n robuuste en maklik-om-te-gebruik oplossing bied vir die handhawing van data-integriteit.
ā¶ Besluitnemingsondersteuning vir kruiper-opsporing ("crawler detection"): 'n Neurale netwerk met PSO-benadering
Om te onderskei tussen menslike gebruikers, "goeie" kruipers (soos soekenjins), en "slegte" kwaadwillige kruipers is noodsaaklik vir webwerf-sekuriteit en verkeersanalise. Hierdie navorsing implementeer neurale netwerke wat ge-optimeer is met partikel-swermoptimering (PSO) om webwerf-verkeersessies te klassifiseer.
Die modelle is getoets in beide stasionĆŖre omgewings en nie-stasionĆŖre omgewings waar "begripsdrywing" voorkom (kruipers wat hul gedrag mettertyd verander). Resultate het getoon dat kwantum-geĆÆnspireerde PSO die neurale netwerke effektief ge-optimeer het om kwaadwillige kruippatrone intyds suksesvol te identifiseer.
ā¶ 'n Vergelykende studie van meta-heuristiek vir hiperparameter-optimering
Hiperparameter-optimering is dikwels 'n "swart-boks" probleem waar afgeleides nie beskikbaar is nie, wat standaard gradiƫntafname onbruikbaar maak. Hierdie studie vergelyk tradisionele metodes soos rooster- ("Grid") en ewekansige ("Random") soektogte teen meta-heuristiek insluitend genetiese algoritmes (GA) en PSO.
Deur 'n toetsstel van SVM's, MLP's en CNN's te gebruik, het die navorsing Friedman- en Nemenyi-toetse ingespan om die algoritmes te rangskik. Die resultate dui aan dat meta-heuristiese raamwerke hoƫ-vlak, probleem-onafhanklike riglyne bied wat komplekse diepleer-argitekture meer doeltreffend kan optimeer as handmatige instelling of uitputtende soekmetodes.
ā¶ Voorspelling van personeel-uitbranding deur gebruik te maak van masjienleer-tegnieke
Terwyl KI dikwels gebruik word vir werwing en personeelverlies, is die toepassing daarvan in die identifisering van uitbranding by werknemers nog besig om te ontwikkel. Hierdie navorsing het verskeie klassifikasiemodelle op menslike kapitaal-data toegepas om welstand-intervensies proaktief te lei.
Die resultate het getoon dat die voorspelling van uitbranding hoogs kompleks is; geen van die modelle het meer as 50% akkuraatheid behaal nie, met kunsmatige neurale netwerke wat die beste gevaar het in 'n moeilike stel data. Die studie beklemtoon die behoefte aan beter datagehalte en etiese veiligheidsrelings wanneer KI op mensgesentreerde werkplekuitdagings toegepas word.
Got it, here is the next batch of 10 research projects translated into Afrikaans. Iāve maintained the exact HTML structure and inline styles to ensure they fit perfectly with the previous sets.
ā¶ Vergelyking van masjienleermodelle vir die klassifikasie van fluoresserende mikroskopiebeelde
Lang-COVID simptome soos moegheid en breinmis word dikwels veroorsaak deur mikroskopiese bloedklonte wat suurstofuitruiling belemmer. Hierdie navorsing ondersoek die gebruik van rekenaarvisie en masjienleer om die identifikasie van hierdie mikrokontjies in fluoresserende mikroskopiebeelde te outomatiseerā'n taak wat tans arbeidsintensief en handmatig is.
Deur spesifieke kenmerke uit die beelde te onttrek, het die studie verskeie algoritmes vergelyk en bevind dat Logistiese Regressie sterk, betroubare prestasie gelewer het in die klassifisering van beide positiewe en negatiewe gevalle. Hierdie outomatisering bied 'n skaalbare manier om diagnoses te bespoedig en pasiƫnte te help om vinniger toegang tot behandeling te kry.
ā¶ Anomalie-opsporing ter ondersteuning van voorspellende instandhouding van steenkoolmeule
Die verskuiwing van voorkomende na voorspellende instandhouding is 'n hoeksteen van Industrie 4.0. Hierdie navorsing fokus op steenkoolmeule en gebruik bewaakte masjienleer om weg te beweeg van vaste instandhoudingskedules na 'n "instandhouding wanneer nodig"-benadering gebaseer op intydse data.
Die studie identifiseer kritiese datagehalte-kwessies in industriƫle sensorlogboeke en ontwikkel 'n model om waarskynlike punte van mislukking te voorspel. Die bevindinge demonstreer dat bewaakte leer bates se beskikbaarheid effektief kan maksimeer deur te verseker dat swaar masjinerie slegs diens kry wanneer 'n faling op hande is, wat koste bespaar en stilstandtyd verminder.
ⶠOnbewaakte modelle vir die identifikasie van finansiële tydreeks-regimes
Finansiƫle markte verskuif voortdurend tussen verskillende "regimes," soos bultye (bull markets) en beartye (bear markets). Om hierdie verskuiwings akkuraat op te spoor is noodsaaklik vir portefeuljebestuur. Hierdie navorsing hersien onbewaakte masjienleer-algoritmes om regimeveranderinge in multivariate data van die Johannesburgse Aandelebeurs (JSE) te identifiseer.
Die studie het verskeie algoritmes vergelyk op grond van hul opsporingsakkuraatheid en die winsgewendheid van die resulterende beleggingstrategieƫ. Die resultate bied aan beleggers 'n raamwerk om markneigings te verstaan en meer ingeligte, data-gedrewe besluite te neem tydens periodes van hoƫ wisselvalligheid.
ā¶ Opsporing van chroniese niersiekte (CKD) deur gebruik te maak van masjienleer-algoritmes
Chroniese niersiekte (CKD) affekteer 10% van die wêreldbevolking, maar vroeë opsporing is moeilik weens simptome wat oorvleuel met ander siektes. Dit is veral kritiek in Suid-Afrika, waar die meerderheid van die bevolking staatmaak op openbare gesondheidstelsels met beperkte hulpbronne.
Hierdie studie het verskeie klassifikasiemodelle ontwikkel en geƫvalueer deur drie internasionale datastelle te gebruik. Die doel was om 'n hoƫ-prestasie model te bou wat in staat is om versteekte korrelasies in pasiƫntsimptome te identifiseer, om uiteindelik 'n nie-indringende, vroeƫ-waarskuwingsinstrument te bied wat toegang tot behandeling in ontwikkelende lande kan revolusioneer.
ⶠKenmerk-ingenieurswese-benaderings vir finansiële tydreeks-voorspelling
Ruis en nie-stasionariteit maak finansiĆ«le voorspelling berug moeilik. Hierdie navorsing toets verskeie kenmerk-ingenieurswese-metodesāsoos Fourier-transformasies, golvies (wavelets), en log-transformasiesāoor modelle insluitend SVR, MLP, en LSTM om te sien of die "skoonmaak" van data werklik prysvoorspellings verbeter.
Die ondersoek het bevind dat hoewel die verwydering van ruis spesifieke modelle kan help, daar geen enkele toweroplossing is nie. Interessant genoeg, terwyl sommige tegnieke rigting-akkuraatheid verbeter het (om te voorspel of die prys styg of daal), was die winste in rou prysvoorspelling klein, wat suggereer dat toekomstige werk op alternatiewe databronne moet fokus eerder as net op historiese pryse alleen.
ā¶ Voorspelling van gewapende konflik deur gebruik te maak van LSTM herhalende neurale netwerke
Die voorspelling van sosiale konflik kan organisasies help om in te gryp voordat geweld eskaleer. Hierdie verhandeling pas Long Short-Term Memory (LSTM) netwerke toe om gebeure in die Afghanistan-konflik te voorspel, deur gebruik te maak van wĆŖreldnuusdata van GDELT en gebeurtenisdata van die Uppsala Conflict Data Program.
Die resultate toon dat die insluiting van nuusmediadataāspesifiek akteur- en gebeurteniskenmerkeābasislynmodelle beduidend verbeter. Deur mediasentiment met werklike aangetekende sterftesyfers te konsolideer, produseer die model voorspellings wat in die werklikheid gegrond is, wat 'n kragtige instrument vir regerings en NRO's bied.
ⶠVergelyking van masjienleermodelle op verskillende finansiële tydreekse
Hierdie studie daag die "Doeltreffende Markhipotese" uit deur te ondersoek of KI 'n 1% voorsprong kan vind in markte soos die S&P 500, Goud, en Bitcoin. Dit het sewe verskillende modelle vergelyk, wat wissel van eenvoudige LineĆŖre Regressie tot komplekse Gated Recurrent Units (GRU).
Verrassend genoeg het LineĆŖre Regressie die mees effektiewe model vir baie bates gebly weens sy eenvoud (parsimonie). Vir spesifieke bates soos die USD/ZAR-paar en Goud het neurale netwerke (MLP) egter akkuraathede van oor die 51-53% behaal, wat bewys dat selfs 'n klein algoritme-voorsprong tot mark-oorprestasie kan lei.
ā¶ Proksimale metodes vir saailing-opsporing en hoogte-assessering
Bosboukwekerye maak tans staat op moeisame handmatige steekproefneming om saailinggroei te monitor. Hierdie studie stel 'n tegnologie-gedrewe alternatief voor: die gebruik van slimfoon RGB-beelde en fotogrammetrie om 3D digitale oppervlakmodelle van saailingbakke te skep.
Deur 'n RetinaNet objekopsporingsmodel en AdaBoost-regressie te gebruik, het die pyplyn 98.97% van saailinge suksesvol opgespoor en hul hoogtes akkuraat bepaal. Dit stel kwekerybestuurders in staat om voorraadhoeveelhede en groeistadiums onmiddellik te verstaan sonder handmatige ingryping, wat operasionele doeltreffendheid beduidend verbeter.
ā¶ Outomatiese boomposisie- en hoogte-beraming vanaf RGB-lugbeelde
Om die fiskale waarde van 'n bos te bepaal, word akkurate boomtellings en hoogtedata benodig. Hierdie navorsing gebruik lugbeelde verkry vanaf hommeltuie en 'n hibriede masjienleerraamwerk (RetinaNet + SVM + MLP) om te verbeter op tradisionele "lokale maxima" algoritmes vir 'n Eucalyptus-plantasie in KwaZulu-Natal.
Die hibriede benadering het boomposisie-akkuraatheid met 15% en hoogte-beraming-akkuraatheid met 25% verbeter. Deur "onwettige" boomposisies (soos skaduwees of dooie bome) met 'n SVM uit te filtreer, bied die stelsel 'n baie meer betroubare skatting van die totale bos-biomassa en waarde.
ā¶ Besluitnemingsondersteuning vir "Fantasy Premier League": 'n Meta-leerder-benadering
"Fantasy Premier League" is 'n strategiese speletjie met miljoene spelers. Hierdie projek hanteer "dream-team" seleksie as 'n wiskundige optimeringsprobleem, deur gebruik te maak van 'n saamgestelde meta-leerder wat voorspellings van vyf verskillende masjienleer-algoritmes kombineer.
Die stelsel gebruik lineĆŖre programmering om speleroordragte voor te stel terwyl begrotings- en groepbeperkings gerespekteer word. In 'n gevallestudie van die 2020/21-seisoen sou hierdie KI-gedrewe benadering in die top 5.98% van al 8 miljoen bestuurders gerangskik het, wat die krag van ensemble-leer in sportanalise bewys.
ā¶ Vereistes vir 3D-voorraadassessering van timmerhout by laaiplekke en terminale
Onakkurate ramings van houtstapelvolumes kan lei tot beduidende knelpunte in die houtvoorsieningsketting. Hierdie projek spreek die behoefte aan vir 'n lae-tegnologie, gereelde en akkurate voorraadbeheerstelsel wat geskik is vir landelike gebiede, deur gebruik te maak van eenvoudige verbruikersvlak-kameras of slimfone.
Deur gebruik te maak van Terrestrial Structure from Motion (SFM) en K-gemiddelde-groepering ("K-means clustering"), onttrek die stelsel houtstapels uit 3D-puntwolke en genereer "alfa-vorms" om volume te voorspel. Die resultate bewys dat rekenaarvisie 'n toeganklike en betroubare alternatief vir handmatige ramings kan bied, selfs in afgeleƫ omgewings met beperkte infrastruktuur.
ā¶ 'n Voorspellende model vir presisie-boommetings deur gebruik te maak van toegepaste masjienleer
Tradisionele bos-enumerasie is moeisame werk en dek dikwels slegs 'n klein fraksie van 'n plantasie. Hoewel hoƫ-vlak laserskandering bestaan, is dit duur en moeilik om te skaal. Hierdie verhandeling ondersoek 'n meer toeganklike roete: die gebruik van gewone slimfoonvideo en Monocular Depth Estimation (MDE) om boomdeursnee op borshoogte (DBH) te meet.
In samewerking met die South African Forestry Company (SAFCOL), het die navorser KI-gegenereerde metings vergelyk met werklike veldwerkdata. Terwyl die foutkoers nog aandag verg, het die model suksesvol ruimtelike voorstellings gegenereer wat werklike koƶrdinate noukeurig weerspieƫl, wat 'n skaalbare pad bied na presisiebosbou deur gebruik te maak van alledaagse mobiele toestelle.