news

4
Datenbank Spektrum (2014) 14:77–80 DOI 10.1007/s13222-014-0151-4 COMMUNITY News Online publiziert: 29. Januar 2014 © Springer-Verlag Berlin Heidelberg 2014 1 LWA 2013 in Bamberg Der traditionelle Herbstworkshop der Fachgruppe Informa- tion Retrieval (IR) fand vom 7.–9. Oktober 2013 im Rahmen der Konferenz „Lernen, Wissen, Adaption“ (LWA) 2013 in Bamberg statt. Traditionell bot die LWA wieder ein Dach für die Workshops verschiedener Fachgruppen innerhalb der Gesellschaft für Informatik. Ziel des IR-Workshops war es, ein Forum zur wissenschaftlichen Diskussion und zum Austausch neuer Ideen zu schaffen. Der Workshop rich- tete sich daher gezielt auch an Nachwuchswissenschaftler und Teilnehmer aus der Industrie. Dementsprechend boten sich interessante Vorträge zu aktuellen Themen aus dem In- formation Retrieval wie Interaktives Information Retrieval, semantische Suche und Anwendungsszenarien. Gemeinsa- men Vortragssitzungen mit den Fachgruppen Knowledge Discovery, Data Mining und Maschinelles Lernen (KDML) sowie Wissensmanagement (WM) waren eine willkomme- ne Gelegenheit, Arbeiten auch über die Grenzen der ei- genen Fachgruppe hinaus zu präsentieren und zu diskutie- ren. Vier Keynotes rundeten die LWA in diesem Jahr ab: „Sys- tematic Approach to the Knowledge Extraction and Struc- turing for Scientific Big Data Analytics“ (Sung-Pil Cho, Yonsei University, Südkorea), „Collaborative Multi-Expert- Systems“ (Klaus-Dieter Althoff, Universität Hildesheim), „Qualitative Representations of Space and Time“ (Diedrich Wolter, Universität Bamberg), und „Smart Grid Data Analy- tics to Promote Energy Efficiency“ (Thorsten Staake, (Uni- versität Bamberg). Auch im nächsten Jahr wird die Fachgruppe IR wieder mit einem Workshop an der LWA teilnehmen, die voraus- sichtlich im September 2014 in Aachen stattfinden wird und von Thomas Seidl organisiert wird. 2 Bericht über das Herbsttreffen der Fachgruppe Datenbanken Am 5. und 6. Dezember 2013 veranstaltete die Fachgruppe Datenbanken erneut ein Symposium zum Thema „Big Da- ta“. Die Veranstaltung war dabei sowohl als Nachfolger des erfolgreichen ersten Big Data Symposiums im Herbst 2012 an der TU München als auch als reguläres Herbsttreffen der Fachgruppe positioniert. Gastgeber war dieses Mal das IBM Forschungs- und Entwicklungszentrum in Böblingen. Mit über 100 Teilnehmern reiht sich das Treffen in die Liste der sehr erfolgreichen Fachgruppentreffen ein, wobei das IBM- Zentrum als Örtlichkeit und die Vor-Ort-Organisation durch Knut Stolze und Team absolut perfekt waren! Wie üblich rankt sich das Herbsttreffen um einen so- zialen Abendevent in Form einer Nachmittags- und einer am darauffolgenden Tag stattfindenden Vormittagsveran- staltung. Das Programm wurde von Wolfgang Lehner und Gerhard Weikum zusammengestellt. Das Nachmittagspro- gramm wurde nach einer kurzen Begrüßung durch Udo Hertz (Leiter IBM Information Management) mit einem ein- geladenen Vortrag von Prof. Christian Jensen eröffnet. Prof. Jensen arbeitet an der Aalborg University in Dänemark und ist einer der international renommiertesten Vertreter der DB- Forschungs-Community. In seinem Vortrag mit dem Titel „Topics in Geo-Spatial Data Management: Spatial Keyword Querying and Beyond“ arbeitete Christian Jensen sehr prä- zise die Anforderungen großer Datenmengen im Kontext ei- ner räumlichen Anfrageverarbeitung heraus und gab ein paar Einblicke in seine aktuellen Forschungsarbeiten in diesem Umfeld. Daran anschließend konnte der Leiter der Datenbank- gruppe der Oracle Labs, Eric Sedlar, begrüßt werden. Eric Sedlar, aus Redwood Shores (CA) angereist, zeigte am Bei- spiel von zwei Projekten die Aktivitäten der Oracle Labs

Upload: marco

Post on 23-Dec-2016

213 views

Category:

Documents


1 download

TRANSCRIPT

Datenbank Spektrum (2014) 14:77–80DOI 10.1007/s13222-014-0151-4

C O M M U N I T Y

News

Online publiziert: 29. Januar 2014© Springer-Verlag Berlin Heidelberg 2014

1 LWA 2013 in Bamberg

Der traditionelle Herbstworkshop der Fachgruppe Informa-tion Retrieval (IR) fand vom 7.–9. Oktober 2013 im Rahmender Konferenz „Lernen, Wissen, Adaption“ (LWA) 2013 inBamberg statt. Traditionell bot die LWA wieder ein Dachfür die Workshops verschiedener Fachgruppen innerhalbder Gesellschaft für Informatik. Ziel des IR-Workshops wares, ein Forum zur wissenschaftlichen Diskussion und zumAustausch neuer Ideen zu schaffen. Der Workshop rich-tete sich daher gezielt auch an Nachwuchswissenschaftlerund Teilnehmer aus der Industrie. Dementsprechend botensich interessante Vorträge zu aktuellen Themen aus dem In-formation Retrieval wie Interaktives Information Retrieval,semantische Suche und Anwendungsszenarien. Gemeinsa-men Vortragssitzungen mit den Fachgruppen KnowledgeDiscovery, Data Mining und Maschinelles Lernen (KDML)sowie Wissensmanagement (WM) waren eine willkomme-ne Gelegenheit, Arbeiten auch über die Grenzen der ei-genen Fachgruppe hinaus zu präsentieren und zu diskutie-ren.

Vier Keynotes rundeten die LWA in diesem Jahr ab: „Sys-tematic Approach to the Knowledge Extraction and Struc-turing for Scientific Big Data Analytics“ (Sung-Pil Cho,Yonsei University, Südkorea), „Collaborative Multi-Expert-Systems“ (Klaus-Dieter Althoff, Universität Hildesheim),„Qualitative Representations of Space and Time“ (DiedrichWolter, Universität Bamberg), und „Smart Grid Data Analy-tics to Promote Energy Efficiency“ (Thorsten Staake, (Uni-versität Bamberg).

Auch im nächsten Jahr wird die Fachgruppe IR wiedermit einem Workshop an der LWA teilnehmen, die voraus-sichtlich im September 2014 in Aachen stattfinden wird undvon Thomas Seidl organisiert wird.

2 Bericht über das Herbsttreffen der FachgruppeDatenbanken

Am 5. und 6. Dezember 2013 veranstaltete die FachgruppeDatenbanken erneut ein Symposium zum Thema „Big Da-ta“. Die Veranstaltung war dabei sowohl als Nachfolger deserfolgreichen ersten Big Data Symposiums im Herbst 2012an der TU München als auch als reguläres Herbsttreffen derFachgruppe positioniert. Gastgeber war dieses Mal das IBMForschungs- und Entwicklungszentrum in Böblingen. Mitüber 100 Teilnehmern reiht sich das Treffen in die Liste dersehr erfolgreichen Fachgruppentreffen ein, wobei das IBM-Zentrum als Örtlichkeit und die Vor-Ort-Organisation durchKnut Stolze und Team absolut perfekt waren!

Wie üblich rankt sich das Herbsttreffen um einen so-zialen Abendevent in Form einer Nachmittags- und eineram darauffolgenden Tag stattfindenden Vormittagsveran-staltung. Das Programm wurde von Wolfgang Lehner undGerhard Weikum zusammengestellt. Das Nachmittagspro-gramm wurde nach einer kurzen Begrüßung durch UdoHertz (Leiter IBM Information Management) mit einem ein-geladenen Vortrag von Prof. Christian Jensen eröffnet. Prof.Jensen arbeitet an der Aalborg University in Dänemark undist einer der international renommiertesten Vertreter der DB-Forschungs-Community. In seinem Vortrag mit dem Titel„Topics in Geo-Spatial Data Management: Spatial KeywordQuerying and Beyond“ arbeitete Christian Jensen sehr prä-zise die Anforderungen großer Datenmengen im Kontext ei-ner räumlichen Anfrageverarbeitung heraus und gab ein paarEinblicke in seine aktuellen Forschungsarbeiten in diesemUmfeld.

Daran anschließend konnte der Leiter der Datenbank-gruppe der Oracle Labs, Eric Sedlar, begrüßt werden. EricSedlar, aus Redwood Shores (CA) angereist, zeigte am Bei-spiel von zwei Projekten die Aktivitäten der Oracle Labs

78 Datenbank Spektrum (2014) 14:77–80

im Umfeld von Big Data: In einem ersten Projekt wird dieOptimierung des „time-to-query“ adressiert. Wesentlich inagilen Big-Data-Anwendungen ist es, die Zeit, Daten inein System zu laden und physisch zu optimieren, so mi-nimal wie möglich zu halten. Oracle Labs arbeitet hierbeian hardware-unterstützen Ladeprozessoren, die Daten „inEchtzeit“ in das Datenbanksystem einbringen können. Daszweite von Eric Sedlar skizzierte Projekt gab einen Einblickin eine auf der Java VM basierenden neuen Laufzeit für dasDatenbanksystem. Die Idee, Anwendungsprogramme sehreng mit Datenbankoperatoren zu vermischen, scheint in die-sem Projekt tatsächlich einen großen Schritt vorangekom-men zu sein. Im Anschluss an Oracle gab Jan Teichmanneinen Einblick in die Big-Data-Strategie der SAP, insbeson-dere im Kontext des hauptspeicherbasierten Datenbanksys-tems HANA. Die Take-Away Message des Beitrags bestanddarin, dass (a) Hardware-Entwicklungen es ermöglichen,auch sehr große Datenbestände im Hauptspeicher halten zukönnen, dass (b) es fundamental wichtig ist, sowohl trans-aktionale als auch analytische Zugriffe im gleichen Systemund sogar auf den gleichen Datenbeständen durchführen zukönnen, und dass (c) SAP für sich „Big“ nicht nur für „Da-ta“, sondern „Big“ auch mit Blick auf eine große Anzahlan Nutzern und eine große Anzahl an Anwendungen defi-niert und Lösungen auch jenseits der reinen Datenbanktech-nik auf Ebene der Geschäftsanwendungen anbietet.

Nach einer bewusst ausführlichen Kaffeepause wurdedie Vortragsreihe wiederum von einem Mitglied der inter-nationalen Datenbank-Community begonnen. Prof. Anata-sia Ailamaki (EPFL) referierte zum Thema „Exploring BigBrain Data“. In der ihr typischen sehr motivierenden und en-gagierten Art begeisterte Prof. Ailamaki mit einer Reise indie Thematik der data-driven science und gab – neben einerEinführung in die Herausforderungen der Gehirnforschungim Kontext des Blue Brain Projects – interessante Einblickein die damit verbundenen Datenbankfragestellungen. AlsBeispiele nannte Anastasia Ailamaki „brain indexing“ und„structural analysis“. Indizierung von Gehirnstrukturdatenist dahingehend komplex, als dass klassische räumliche In-dexstrukturen diese speziellen biologischen Strukturen nursehr schlecht repräsentieren können. Mit ihrem speziellenAnsatz FLAT zeigte sie eine innovative Art die Beschrän-kungen zu umgehen. Als weitere Herausforderung adres-sierte Prof. Ailamaki die Eigenschaft, sich an Gehirnstruk-turen bei einer Navigation in der Datenanalyse zu orientie-ren. Um hier interaktiv arbeiten zu können, stellte sie mitdem Projekt SCOUT eine inhaltsbezogene Pre-Fetching-Strategie vor – Experimente auf Basis echter Datenbestän-de belegen einen signifikanten Speedup. Als Vertreter derGruppe von Big-Data-Anwendungen stellte in einem letztenVortrag an diesem Nachmittag Justin Coffey von der FirmaCriteo ein Big-Data-Anwendungsszenario vor. Criteo analy-siert Web-Logs und leitet daraus personalisierte Werbestra-tegien ab. Im Rahmen des Vortrags erläuterte Justin Coffey

die weltweite Datensammel- und Datenkonsolidierungsin-frastruktur und zeigte eindrucksvoll, dass zwar Big Data be-reits möglich ist, aber auch noch sehr viel (auch von Seitender Forschung) zu tun ist, um Big Data-Anwendungen imgroßen Stil zu ermöglichen.

Den Abend rundete ein ausgezeichnetes Dinner im Mer-cure Bristol Hotel ab – in diesem Zusammenhang ein großesDankeschön für das Sponsoring durch IBM.

Der zweite Tag wurde eröffnet mit einem Vortrag vonFelix Naumann vom Hasso-Plattner-Institut in Potsdam,der neue Ergebnisse aus dem Bereich Big Data Profi-ling vorstellte, insbesondere neue effiziente Algorithmenfür das Finden von eindeutigen Spaltenkombinationen ingroßen Tabellen. Jens Seifert (IBM) gab anschließendeinen Überblick über die Architektur von DB2 BLU, derHauptspeicher-Datenbank von IBM, und ging besonders aufKomprimierung von Daten und die transparente Einbindungvon Hauptspeicherdaten in die Ausführung von Anfragenein. Marc Spaniol (Max-Planck-Institut für Informatik Saar-brücken) ging in seinem anschließenden Vortrag auf Her-ausforderungen und mögliche Lösungsansätze für TemporalWeb Analytics ein. Den Abschluss der Vorträge bildete derVortrag von Harald Schöning (Software AG), der Einblickein Big Data bei der Software AG gab.

Die interessanten Vorträge wurden abgerundet durch einPanel über den Einfluss von Big Data auf die Informati-kausbildung, das von Bernhard Mitschang (Uni Stuttgart)moderiert wurde. Die Panelisten Johann Christoph Freytag(Humboldt-Universität zu Berlin), Harald Schöning (Soft-ware AG), Gerhard Weikum (Max-Planck-Institut für Infor-matik) und Thomas Ruf (GfK) beleuchteten dabei sowohlAspekte aus der Sicht von Wissenschaft und Forschung alsauch aus Anwendungssicht.

An dieser Stelle also nochmals vielen Dank für die Teil-nahme, an alle Sprecher und insbesondere auch Dank anIBM für die umfangreiche Unterstützung.

3 Autumn School 2014 for Information Retrievaland Information Foraging (Herbstschule)

Die Fachgruppe Information Retrieval veranstaltet vom 21.–26. September 2014 erneut eine Herbstschule, die diesmalerstmals komplett auf Englisch durchgeführt wird. Im be-währten Ambiente von Schloss Dagstuhl, dem Ausbildungs-und Begegnungszentrum der Gesellschaft für Informatik,werden Kenntnisse über die Problembereiche und Erfolgs-faktoren im Information Retrieval vermittelt. Dazu werdenneben einführenden und grundlegenden Themen des Infor-mation Retrievals und des Information Foraging insbeson-dere aktuelle Forschungsfragen angesprochen. Die folgen-den Themen sind vorgesehen und werden von namhaftenExperten vorgestellt:

Datenbank Spektrum (2014) 14:77–80 79

– Models of Information Retrieval (Prof. Dr. Ingo Fromm-holz, University of Bedfordshire, und Prof. Dr. ThomasRoelleke, Queen Mary, University of London)

– Evaluation (Prof. Dr. Thomas Mandl, Universität Hildes-heim)

– Task Based Analysis (Prof. Dr. Pia Borlund, Royal School,Aalborg)

– Information Behavior (Prof. Dr. Katriina Byström, Uni-versity of Borås)

– Log File Analysis (Prof. Dr. Wessel Kraaij, Radboud Uni-versity)

– Multimedia Retrieval (Prof. Dr. Stefan Rüger, The OpenUniversity, Milton Keynes)

– Interactive Information Retrieval (Prof. Dr. Norbert Fuhr,Universität Duisburg-Essen)

– Interfaces for Search (tba)

Suche und Suchmaschinen bilden einen wichtigen For-schungsbereich mit zahlreichen möglichen Anwendungsfel-dern. Die Autumn School 2014 for Information Retrievaland Information Foraging richtet sich an Anwender, Ent-wickler sowie Studierende aus Wissenschaft und Praxis. DieAutumn School steht in der Tradition der Herbstschule IRund der Summer School Information Foraging, welche vonder Radboud University in Nijmegen veranstaltet wurde.

Weitere Informationen und Möglichkeit zur Anmeldungfinden Sie unter http://tinyurl.com/asirf2014. Bei Anmel-dung bis zum 15. Juli 2014 gelten ermäßigte Teilnahmebei-träge.

4 IIiX 2014 in Regensburg

The Information Interaction in Context (IIiX) conferenceexplores the relationships between and within the contextsthat affect information retrieval and information seeking,how these contexts influence information behaviours, andhow knowledge of information contexts and behaviours im-proves the design of interactive information systems. IIiX2014 will be held in the beautiful Regensburg, Germany nextAugust (see http://bit.ly/1fbXzlF), with David Elsweiler andBernd Ludwig (both University of Regensburg) as generalco-chairs.

The overarching theme for IIiX 2014 is building bridges– between the main themes of the conference, which are of-ten treated in isolation and between researchers from differ-ent communities. The intention of IIiX is to foster an inte-grated approach to information access by bringing togethermembers of the research communities in information seek-ing behaviour, user interface design, interactive informationretrieval and system design.

With the focus on information interaction in context, weare inviting submissions that focuses on or combines the fol-lowing themes: People and Behaviours, Interfaces, Systems,Evaluation.

We are looking for high quality original research of rel-evance to IIiX. This year we are encouraging a variety ofpaper types and invite authors to consider submitting pa-pers that provide empirical and experimental contributions,conceptual and theoretical contributions, and reflections andexperience-based contributions, or a combination of.

It is also possible to contribute short papers that shouldbe original, high-quality submissions, like full papers, butbased upon a smaller, concise contribution. Consequently,we are looking for a range of short paper submissions thatdescribe work in progress, late-breaking results, and reportson projects, applications, software releases and demos. Shortpapers will be presented as part of an interactive poster ses-sion to provide an open forum for discussion and future col-laboration between participants. Also, selected topically rel-evant and interesting short papers will be chosen for oralpresentation to highlight the best of these smaller but strongsubmissions.

The submission deadline is April 23, 2014 for full papers,and May 7, 2014 for short papers. Full details of the call areavailable from http://bit.ly/16bDw5G.

5 Produkt-News

Uta Störl

5.1 Oracle Database 11g – Final Release freigegeben

Nachdem im Sommer 2013 bereits das neueste Relea-se der Oracle Datenbank (12.1) freigegeben wurde (sieheDatenbank-Spektrum 03/2013), erhielt Ende Oktober 2013das sogenannte final release der Datenbank mit der Versi-onsnummer 11.2.0.4 die Freigabe. Das Release enthält ne-ben den üblichen Fehlerkorrekturen einige neue Features,die aus dem 12er Release zurückübernommen (backported)wurden. Im Security Bereich etwa wurde das Feature DataRedaction übernommen, mit dem es möglich ist, sicherheits-kritische Daten bei jeder Ausgabe zu maskieren, ohne dieseDaten im Original zu verändern. Data Redaction wird ver-wendet, um zum Beispiel Teile von Kreditkartennummernauf Zahlungsbelegen durch das Zeichen ‘*’ oder ein ande-res beliebiges Zeichen zu ersetzen. Der Standardsupport fürdie Version 11.2.0.4 endet im Januar 2015.

Oracle, http://www.oracle.com/

5.2 PostgreSQL 9.3 veröffentlicht

Version 9.3 des freien Datenbankmanagementsystems Post-greSQL wurde veröffentlicht. Als wichtigste Neuerung wirdvon den Entwicklern die Möglichkeit des bidirektionalen

80 Datenbank Spektrum (2014) 14:77–80

Datenaustauschs mit anderen Systemen basierend auf ei-nem Foreign Data Wrapper (FDW) angeben. Weitere Ver-änderungen sind u.a. zusätzliche JSON-Funktionalitäten,Updatable VIEWs und die Parallelisierung der Dump-Funktionalität zur Verbesserung der Backup-Geschwindig-keit.

PostgeSQL, http://www.postgresql.org/

5.3 Couchbase lite für Mobilgeräte

Couchbase hat eine mobile Version seines dokumenten-orientierten NoSQL-Datenbankmanagementsystems vorge-stellt: Couchbase lite. Couchbase lite steht derzeit als BetaVersion 2 zur Verfügung und unterstützt iOS und Android.Für die Programmierung werden derzeit REST- und Objec-tive C-APIs unterstützt – ein Java-API ist angekündigt.

Couchbase, http://www.couchbase.com/mobile

5.4 Oracle: Exadata Database Machine X4-2 und OracleDatabase 12c

Seit Dezember 2013 ist die fünfte Generation der Exada-ta Database Machine offiziell verfügbar. Mit der neuen Ma-schinengeneration ist es nun möglich, nicht nur Oracle Da-tabase 11g Release 2, sondern auch die im letztem Som-mer vorgestellte Oracle Database 12c (siehe Datenbank-Spektrum 03/2013) mit dem vollen Funktionsumfang zunutzen. Der Kunde kann wie bisher zwischen dem ModellX4-2 als Eighth-, Quarter-, Half- oder Full Rack und demModell X3-8 als Full Rack mit jeweils unterschiedlicherFestplattenkonfiguration wählen.

In der Exadata Database Machine X4-2 kommen nun ak-tuelle Standard Sun Server X4-2 mit neuem 12-Core IntelXeon E5-2697 v2 Prozessor (2,7GHz) als Datenbankserverzum Einsatz. Deren interne Festplatten wurden von 300 GBauf 600 GB Größe verdoppelt, der standardmäßig zur Verfü-gung stehende Hauptspeicher von 256 GB kann mit einemoptionalen Memory Expansion Kit auf 512 GB vergrößertwerden. Für die interne Vernetzung der Server in der Exada-ta Database Machine über InfiniBand werden nun PCIe 3.0Ports genutzt, wobei durch den Betrieb beider IB Ports imActive/Active Modus noch mehr Bandbreite zur Verfügungsteht. Mit den vorgestellten Hardwareerweiterungen eignetsich die Exadata Database Machine noch besser für die Kon-solidierung mehrerer Oracle Datenbanken.

Die Datenbankserver im Modell X3-8 sind unverändertgeblieben, jedoch wird auch in diesem Modell jetzt auf SunServer X4-2L als zentraler Speicher-Baustein aller Enginee-red Systems mit Exadata Storage Technologie gesetzt. Mitneuen, schnelleren Six-Core Intel Xeon E5-2630 v2 Prozes-soren (2,6 GHz) ausgestattet, verfügt jeder Exadata Stora-ge Server nun über 96 GB Hauptspeicher. Der zusätzlicheHauptspeicher wird benötigt, um den auf vier Sun Flash Ac-celerator F80 PCIe Karten befindlichen Flash Speicher voninsgesamt 3,2 TB zu adressieren. Als Festplatten kann derKunde zwischen 1,2 TB 10k RPM High Performance oder4 TB 7,2 RPM High Capacity Festplatten wählen. Damitstehen in einer Exadata Database Machine Full Rack bis zu672 TB reiner Festplattenplatz, 44,8 TB reiner Flash Spei-cher und bis zu 4 TB Hauptspeicher zur Verfügung.

Oracle, http://www.oracle.com/

Danksagung Dank an Heinz-Wilhelm Fabry und Frank Schneede(beide Oracle) für ihren fachlichen Input.