Microsoft Fabric Lakehouse yhdistää Data Laken joustavuuden ja Data Warehousen luotettavuuden yhdeksi tehokkaaksi alustaksi. OneLake ja Delta Lake -teknologiat mahdollistavat strukturoidun ja ei-strukturoidun datan käsittelyn samassa ympäristössä.
Avainsanat: Fabric Lakehouse, OneLake, Delta Lake, Microsoft Fabric data platform, Lakehouse arkkitehtuuri, Fabric data lake
Lakehouse ei ole kompromissi, se on paras molemmista maailmoista. Voit tallentaa raakadataa, JSON-tiedostoja, lokeja ja kuvia Data Laken tapaan, mutta samalla tehdä SQL-kyselyitä, ACID-transaktioita ja rakentaa BI-raportteja kuten perinteisessä tietovarastossa. Microsoft Fabric tekee tästä vieläkin helpompaa OneLake-konseptilla.
OneLake on vallankumouksellinen konsepti. Se on kuin "OneDrive datalle", yksi yhtenäinen tallennuspaikka, joka on automaattisesti käytettävissä kaikissa Fabric-työkaluissa. Ei enää mount-operaatioita, connection stringejä tai datan kopiointia palvelusta toiseen.
Microsoft Fabric Lakehouse perustuu Delta Lake -teknologiaan, joka on avoimen lähdekoodin projekti. Delta tuo ACID-transaktiot, schema enforcement ja time travel -ominaisuudet Parquet-tiedostoihin. Tämä tarkoittaa, että datanne ei ole lukittu Microsoftin ekosysteemiin.
Hyvin suunniteltu Lakehouse jakautuu loogisiin kerroksiin, jotka jalostava dataa raakamuodosta liiketoimintavalmiiksi:
Jokainen Fabric Lakehouse saa automaattisesti SQL Analytics Endpointin. Tämä on read-only SQL-näkymä Lakehouse-dataan, joka mahdollistaa T-SQL-kyselyt suoraan Delta-tauluihin. Power BI, Excel ja muut työkalut voivat yhdistää suoraan tähän endpointiin.
SQL Analytics Endpoint ei ole kopio datasta, se on live-näkymä samaan dataan. Muutokset Lakehousessa näkyvät välittömästi SQL-puolella. V-Order-optimointi tekee kyselyistä salamannopeita, vaikka data olisi petabyte-luokkaa.
Fabric Lakehouse tukee Apache Spark -pohjaista kehitystä. Voit kirjoittaa PySpark-, Scala-, SparkSQL- tai R-koodia Notebook-ympäristössä. Spark-sessiot käynnistyvät sekunneissa (Live Pool), ja skaalautuvat automaattisesti työkuorman mukaan.
Shortcutsien avulla voit luoda "pikakuvakkeen" dataan, joka sijaitsee Azure Data Lake Storagessa, AWS S3:ssa tai toisessa OneLake-sijainnissa. Dataa ei kopioida, se vain näkyy osana Lakehousea.
Tämä on erityisen hyödyllistä, kun haluat hyödyntää olemassa olevaa Data Lakea tai jakaa dataa eri Fabric-kapasiteettien välillä. Shortcuts toimivat myös cross-tenant, eli voit jakaa dataa turvallisesti kumppaniorganisaatioiden kanssa.
Fabric Lakehouse on optimaalinen alusta koneoppimiselle. Data scientistit voivat työskennellä suoraan raakadatan kanssa, rakentaa feature engineering -putkia ja tallentaa mallit MLflow-rekisteriin. Kaikki samassa ympäristössä, ilman datan siirtoa.
Microsoft Solutions Partner (Data & AI, Azure) -kumppanina autamme suunnittelemaan, toteuttamaan ja optimoimaan Fabric Lakehouse -ratkaisunne. Sertifioidut asiantuntijamme varmistavat, että Lakehousenne on suorituskykyinen, skaalautuva ja kustannustehokas.
Oli kyseessä ensimmäinen Lakehouse-projekti tai olemassa olevan Data Laken modernisointi Fabriciin, meillä on osaaminen ja kokemus viedä projekti maaliin.
Lue lisää viimeaikaisista projekteistamme
Ota yhteyttä ja kerromme mielellämme enemmän palveluistamme ja tekemästämme työstä.
Tämä sivusto käyttää evästeitä palveluiden toimittamisessa, käyttäjäkokemuksen parantamisessa ja liikenteen analysoinnissa