Пређи на садржај

Моделовање података

С Википедије, слободне енциклопедије

Моделовање података у софтверском инжењерству је процес креирања модела података за информациони систем применом одређених формалних техника. Може се примењивати као део ширег концепта инжењерства вођеног моделима.

Процес моделовања података. Слика илуструје начин на који се модели података данас развијају и користе. Концептуални модел података се развија на основу захтева за подацима за апликацију која се развија, нпр у контексту модела активности. Модел података обично ће се састојати од типова ентитета, атрибута, релација, правила интегритета и дефиниција тих објеката. Он се затим користи као полазна тачка за дизајн интерфејса или базе података.[1]

Уопштено

[уреди | уреди извор]

Моделовање података је процес који се користи за дефинисање и анализу захтева у погледу података који су неопходни за подршку пословним процесима у оквиру одговарајућих информационих система у организацијама. Због тога процес моделовања података подразумева да људи који се баве моделовањем података блиско сарађују са пословним актерима, као и са потенцијалним корисницима информационог система.[2]

Постоје три различите врсте модела података који се израђују током преласка од захтева до стварне базе података која ће се користити за информациони систем. Захтеви у погледу података се најпре бележе као концептуални модел података, који представља скуп технолошки независних спецификација о подацима и користи се за дискусију о почетним захтевима са пословним актерима. Концептуални модел се затим преводи у логички модел података, који документује структуре података које се могу имплементирати у базама података. Имплементација једног концептуалног модела података може захтевати више логичких модела података. Последњи корак у моделовању података је трансформација логичког модела података у физички модел података, који организује податке у табеле и узима у обзир детаље у вези са приступом, перформансама и складиштењем. Моделовање података дефинише не само елементе података, већ и њихове структуре и односе између њих.[3]

Технике и методологије моделовања података користе се за моделирање података на стандардан, доследан и предвидив начин како би се њима управљало као ресурсом. Употреба стандарда за моделовање података снажно се препоручује за све пројекте који захтевају стандардни начин дефинисања и анализе података у оквиру организације. Моделовање података служи за:

  • пружање помоћи пословним аналитичарима, програмерима, тестерима, писцима приручника, лицима која бирају ИТ пакете, инжењерима, менаџерима, повезаним организацијама и клијентима да разумеју и користе договорени полуформални модел који обухвата концепте организације и њихове међусобне односе
  • управљање подацима као ресурсом
  • интеграцију информационих система
  • за дизајн база података / складишта података

Моделовање података може се спроводити током различитих врста пројеката и у више фаза пројекта. Модели података су прогресивни; не постоји коначан модел података за неки посао или апликацију. Уместо тога, модел података треба посматрати као живи документ који ће се мењати у складу са променама у пословању. Модели података идеално би требало да буду смештени у репозиторијуму како би могли да се временом преузимају, проширују и уређују.

Постоје две врсте моделовања података:

  • Стратешко моделовање података - ово је део креирања стратегије информационих система, која дефинише укупну визију и архитектуру информационих система.
  • Моделовање података током анализе система - у анализи система креирају се логички модели података као део развоја нових база података.
Како модели података доносе корист

Модели података

[уреди | уреди извор]

Модели података обезбеђују оквир за коришћење података унутар информационих система тако што пружају прецизне дефиниције и формате. Ако се модел података доследно користи у различитим системима, може се постићи компатибилност података. Уколико се исте структуре података користе за складиштење и приступ подацима, различите апликације могу несметано да размењују податке. Међутим, системи и интерфејси су често скупи за изградњу, рад и одржавање. Они такође могу ограничавати пословање уместо да га подржавају. Ово се може десити када је квалитет модела података имплементираних у системима и интерфејсима лош.

Неки уобичајени проблеми који се јављају у моделима података су:

  • Пословна правила, специфична за начин на који се нешто ради на одређеном месту, често су уграђена у структуру модела података. То значи да мале промене у начину пословања доводе до великих промена у рачунарским системима и интерфејсима. Због тога пословна правила треба имплементирати на флексибилан начин који не ствара компликоване зависности. Модел података треба да буде довољно флексибилан да се промене у пословању могу релативно брзо и ефикасно применити унутар самог модела података.
  • Типови ентитета често нису идентификовани или су погрешно идентификовани. Ово може довести до дуплирања података, структура података и функционалности, као и до додатних трошкова за развој и одржавање који прате такво дуплирање. Стога дефиниције података треба да буду што експлицитније и лакше за разумевање како би се минимизирале погрешне интерпретације и дупликати.
  • Модели података за различите системе су произвољно различити. Последица тога је потреба за сложеним интерфејсима између система који деле податке. Ови интерфејси могу чинити између 25% и 70% трошкова савремених система. Потребни интерфејси треба да се разматрају већ при дизајнирању модела података, јер модел података сам по себи не би био употребљив без интерфејса са различитим системима.
  • Подаци се не могу електронски делити са купцима и добављачима, јер структура и значење података нису стандардизовани. Да би се добила оптимална вредност од имплементираног модела података, веома је важно дефинисати стандарде који ће осигурати да модели података истовремено задовољавају пословне потребе и буду доследни.

Процес моделовања података

[уреди | уреди извор]

У контексту интеграције пословних процеса, моделовање података допуњује моделовање пословних процеса и на крају доводи до генерисања базе података.

Процес дизајнирања базе података укључује израду три врсте шема – концептуалне, логичке и физичке. Дизајн базе података документован у овим шемама се конвертује кроз Data Definition Language (Језик за дефинисање података), који се затим може користити за генерисање базе података. Потпуно атрибутован модел података садржи детаљне атрибуте (описе) за сваки ентитет у њему. Термин „дизајн базе података“ може обухватити многе различите делове дизајна целокупног система базе података. Првенствено, и најтачније, може се сматрати логичким дизајном основних структура података које се користе за складиштење података. У објектној бази података ентитети и релације се директно мапирају на класе објеката и именоване релације. Међутим, термин „дизајн базе података“ може се користити и за цео процес дизајнирања, не само основних структура података, већ и формулара и упита који се користе као део целокупне апликације базе података унутар Database Management System (DBMS).

У овом процесу, системски интерфејси чине између 25% и 70% трошкова развоја и подршке савремених система. Главни разлог ових трошкова је то што системи не деле заједнички модел података. Ако се модели података развијају на нивоу појединачних система, онда се не само поново изводи иста анализа у преклапајућим областима, већ је потребно извршити додатну анализу да би се креирали интерфејси између њих. Већина система у оквиру организације садржи исте основне податке, који се поново развијају за одређену сврху. Због тога ефикасно дизајниран основни модел података може минимизирати поновни рад уз минималне модификације за потребе различитих система у оквиру организације.[4]

Методологије моделовања

[уреди | уреди извор]

Модели података представљају области информација које су од интереса. Иако постоје различити начини креирања модела података, према Лену Силверстону (1997), само две методологије моделовања се издвајају: одозго-надоле (top-down) и одоздо-нагоре (bottom-up):

  • Модели одоздо-нагоре или модели интеграције приказа (View Integration models) често су резултат рефактурисања кода. Они обично почињу од постојећих структура података, формулара, поља на апликацијским екранима или извештаја. Ови модели су обично физички, специфични за апликацију и непотпуни из перспективе целе организације. Они можда не промовишу дељење података, нарочито ако су креирани без референцирања на друге делове организације.
  • Логички модели података одозго-надоле се, с друге стране, креирају апстрактно тако што се информације добијају од људи који познају предметну област. Систем можда неће имплементирати све ентитете из логичког модела, али модел служи као референтна тачка или шаблон.

Понекад се модели креирају комбинацијом оба метода: разматрањем потреба за подацима и структуре апликације, уз доследно реферисање на модел предметне области. У многим окружењима граница између логичког и физичког модела података није јасна.[5]

Дијаграми објекти-везе

[уреди | уреди извор]

Постоји неколико нотација за моделовање података. Сам модел се често назива „модел објекат-веза“, јер приказује податке у терминима ентитета и релација описаних у подацима.

Модел објекат-веза је апстрактна концептуална представa структуираних података. Моделовање објекат-веза је метода за моделовање релационих шема база података, која се користи у софтверском инжењерству за израду врсте концептуалног модела података (или семантичког модела података) система, често релационе базе података, и њених захтева на принципу одозго-надоле (top-down).

Ови модели се користе у првој фази дизајна информационог система, током анализе захтева, како би описали потребе за информацијама или врсту информација која ће бити складиштена у бази података. Техника моделовања података може се користити за преглед и класификацију коришћених термина и њихових односа, односно области интересовања.

Развијено је више техника за дизајн модела података. Иако ове методологије воде моделаре података у њиховом раду, две различите особе које користе исту методологију често ће доћи до веома различитих резултата. Најпознатије су:

  • Бахман дијаграми (Bachman diagrams)
  • Баркеровa нотација (Barker's notation)
  • Ченова нотација (Chen's notation)
  • Data Vault моделовање (Data Vault Modeling)
  • Проширени Бекус–Наур облик (Extended Backus–Naur form)
  • IDEF1X
  • Објектно-релационо мапирање (Object-relational mapping)
  • Object-Role Modeling и Fully Communication Oriented Information Modeling
  • Релациони модел (Relational Model)
  • Релациони модел / Tasmania (Relational Model/Tasmania)

Опште моделовање података

[уреди | уреди извор]

Општи модели података представљају генерализације конвенционалних модела података. Они дефинишу стандардизоване опште типове релација, заједно са врстама објеката који могу бити повезани тим типом релације. Дефиниција општег модела података слична је дефиницији природног језика. На пример, општи модел података може дефинисати типове релација као што су „релација класификације“, која представља бинарну релацију између појединачног објекта и врсте објекта (класe), и „релација део–целина“, која представља бинарну релацију између два објекта, један са улогом дела, други са улогом целине, без обзира на врсту објеката који су повезани.

Са проширивом листом класа, ово омогућава класификацију било ког појединачног објекта и одређивање релација део–целина за било који појединачни објекат. Стандардизацијом надоградиве листе типова релација, општи модел података омогућава изражавање неограниченог броја врста чињеница и приближава се могућностима природних језика. Конвенционални модели података, с друге стране, имају фиксну и ограничену област примене, јер коришћење таквог модела омогућава изражавање само оних врста чињеница које су унапред дефинисане у самом моделу.

Семантичко моделовање података

Семантичко моделовање података

[уреди | уреди извор]

Логичка структура података у СУБП-у (Систем за управљање базом података), без обзира да ли је хијерархијска, мрежна или релациона, не може у потпуности да задовољи захтеве за концептуалну дефиницију података, јер је ограничена у обиму и пристрасна према стратегији имплементације коју користи СУБП. То јест, осим ако се семантички модел података намерно не имплементира у базу података, избор који може мало утицати на перформансе, али генерално значајно побољшава продуктивност.

Стога, потреба да се подаци дефинишу из концептуалне перспективе довела је до развоја техника семантичког моделовања података. То су технике за дефинисање значења података у контексту њихових међусобних односа са другим подацима. Као што је приказано на слици, стварни свет, у смислу ресурса, идеја, догађаја и сл., симболички се дефинише његовим описом у физичким складиштима података. Семантички модел података је апстракција која дефинише како складиштени симболи одговарају стварном свету. Стога модел мора бити истинита репрезентација стварног света.

Сврха семантичког моделовања података је да се креира структурни модел дела стварног света, названог „универзум дискурса“. За то се разматрају три основне структурне релације:

  • Класификација/инстанцирање: Објекти са одређеном структурном сличношћу се описују као инстанце класа.
  • Агрегација/декомпозиција: Састављени објекти се добијају спајањем њихових делова.
  • Генерализација/специјализација: Различите класе са заједничким својствима се разматрају у општијој класи са заједничким атрибутима.

Семантички модел података може се користити за многе сврхе, као што су:

  • Планирање ресурса података
  • Креирање база података које се могу делити
  • Евалуација софтвера добављача
  • Интеграција постојећих база података[6]

Општи циљ семантичких модела података је да се ухвати више значења података интегрисањем релационих концепата са моћнијим апстракцијама познатим из области вештачке интелигенције.[7]

Референце

[уреди | уреди извор]
  1. ^ West, Matthew (2011), Data Models and Enterprise Architecture, Elsevier, стр. 37—50, ISBN 978-0-12-375106-5, Приступљено 2025-12-22 
  2. ^ Simsion, Graeme C.; Witt, Graham C. (2005). Data modeling essentials (3rd ed изд.). Amsterdam ; Boston: Morgan Kaufmann Publishers. ISBN 978-0-12-644551-0. 
  3. ^ Dailey, Daniel J.; Pond, Luke. „Traffic Data Acquisition and Distribution: Archived Data User Services Data Mine”. Transportation Research Record: Journal of the Transportation Research Board. 1768 (1): 162—171. ISSN 0361-1981. doi:10.3141/1768-20. 
  4. ^ McGee, David; Schlaepfer, Dieter; Weiss, Richard; Malraison, Pierre J. (1993), New Perspectives on Computer-Aided Design: Techniques of AutoCAD Software in the CAD/CAE Process, Elsevier, стр. 57—96, Приступљено 2025-12-18 
  5. ^ Silverston, Len; Inmon, William H.; Graziano, Kent (1997). The data model resource book: a library of logical data models and data warehouse designs. New York: Wiley. ISBN 978-0-471-15364-1. 
  6. ^ Rodriguez, Kelsey (2021-02-09). NIST time and frequency bulletin (Извештај). Gaithersburg, MD: National Institute of Standards and Technology (U.S.). 
  7. ^ Klas, Wolfgang; Schrefl, Michael (1995). Metaclasses and Their Application: Data Model Tailoring and Database Integration. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg. ISBN 978-3-540-60063-3.