CIDR Proceedings

Proceedings of CIDR

Session 1: Query Optimization

Simplicity Done Right for Join Ordering

Axel Hertzschuch, Claudio Hartmann, Dirk Habich, Wolfgang Lehner

PDF

Progressive Join Algorithms Considering User Preference

Mengsu Ding, Shimin Chen, Nantia Makrynioti, Stefan Manegold

PDF

Accelerating Complex Analytics using Speculation

Panagiotis Sioulas, Viktor Sanca, Ioannis Mytilinis, Anastasia Ailamaki

PDF

Session 2: Blockchain and Transactions

chainifyDB: How to get rid of your Blockchain and use your DBMS instead

Felix Schuhknecht

PDF

Fraud Buster: Tracking IRSF Using Blockchain While Protecting Business Conﬁdentiality

Shuaicheng Ma, Tamraparni Dasu, Yaron Kanza

PDF

Contention and Space Management in B-Trees

Adnan Alhomssi, Viktor Leis

PDF

Session 3: Data Analytics

Putting Pandas in a Box

Stefan Hagedorn, Steffen Kläbe, Kai-Uwe Sattler

PDF

Magpie: Python at Speed and Scale using Cloud Backends

Alekh Jindal, K Venkatesh Emani, Maureen Daum, Olga Poppe, Brandon Haynes, Anna Pavlenko, Ayushi Gupta, Karthik Ramachandra, Carlo Curino, Andreas Mueller, Wentao Wu, Hiren Patel

PDF

Leam: An Interactive System for In-situ Visual Text Analysis

Sajjadur Rahman, Peter Griggs, Çağatay Demiralp

PDF

Session 4: New Database Engines

AnyDB: An Architecture-less DBMS for Any Workload

Tiemo Bang, Norman May, Ilia Petrov, Carsten Binnig

PDF

VergeDB: A Database for IoT Analytics on Edge Devices

John Paparrizos, Chunwei Liu, Bruno Barbarioli, Johnny Hwang, Ikraduya Edian, Aaron J Elmore, Michael J Franklin, Sanjay Krishnan

PDF

Boxer: Data Analytics on Network-enabled Serverless Platforms

Michael Wawrzoniak, Ingo Müller, Rodrigo Fraga Barcelos Paulus Bruno, Gustavo Alonso

PDF

Session 5: (Semi)-Supervised Learning

Bootleg: Chasing the Tail with Self-Supervised Named Entity Disambiguation

Laurel Orr, Megan Leszczynski, Neel Guha, Sen Wu, Simran Arora, Xiao Ling, Christopher Ré

PDF

Semi-Supervised Data Cleaning with Raha and Baran

Mohammad Mahdavi, Ziawasch Abedjan

PDF

Learned Approximate Query Processing: Make it Light, Accurate and Fast

Qingzhi Ma, Ali M Shanghooshabad, Mehrdad Almasi, Meghdad Kurmanji, Peter Triantafillou

PDF

Session 6: Trends and New Directions

New Directions in Cloud Programming

Alvin Cheung, Natacha Crooks, Joseph M Hellerstein, Mae Milano

PDF

Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics

Michael Armbrust, Ali Ghodsi, Reynold Xin, Matei Zaharia

PDF

Challenges and Opportunities for Autonomous Vehicle Query Systems

Fiodar Kazhamiaka, Matei Zaharia, Peter Bailis

PDF

Session 7: Data Structures

The Case for Distance-Bounded Spatial Approximations

Eleni Tzirita Zacharatou, Andreas Kipf, Ibrahim Sabek, Varun Pandey, Harish Doraiswamy, Volker Markl

PDF

Hist-Tree: Those Who Ignore It Are Doomed to Learn

Andrew Crotty

PDF

Everything is a Transaction: Unifying Logical Concurrency Control and Physical Data Structure Maintenance in Database Management Systems

Ling Zhang, Matthew Butrovich, Tianyu Li, Yash Nannapanei, Andrew Pavlo, John Rollinson, Huanchen Zhang

PDF

Session 8: Privacy and Security

Integrity-based Attacks for Encrypted Databases and Implications

Arvind Arasu, Raghav Kaushik, Donald Kosmann, Ravi Ramamurthy

PDF

Encrypted Databases: From Theory to Systems

Zheguang Zhao, Seny Kamara, Tarik Moataz, Aroki Systems, Stan Zdonik

PDF

Sypse: Privacy-first Data Management through Pseudonymization and Partitioning

Amol Deshpande

PDF

Session 9: Platforms for Machine Learning

Cerebro: A Layered Data Platform for Scalable Deep Learning

Arun Kumar, Supun Nakandala, Yuhao Zhang, Side Li, Advitya Gemawat, Kabir Nagrecha

PDF

Ease.ML: A Lifecycle Management System for Machine Learning

Leonel Aguilar, David Dao, Shaoduo Gan, Nezihe Merve Gurel, Nora Hollenstein, Jiawei Jiang, Bojan Karlas, Thomas Lemmin, Tian Li, Yang Li, Susie Rao, Johannes Rausch, Cedric Renggli, Luka Rimanic, Maurice Weber, Shuai Zhang, Zhikuan Zhao, Kevin Schawinski, Wentao Wu, Ce Zhang

PDF

Lightweight Inspection of Data Preprocessing in Native Machine Learning Pipelines

Stefan Grafberger, TU Munich, Julia Stoyanovich, Sebastian Schelter

PDF

Session 10: Storage and Performance

Bridging the Chasm between Science and Reality

Martin Kersten, Panagiotis Koutsourakis, Niels Nes, Ying Zhang

PDF

Computational Storage: Where Are We Today?

Antonio Barbalace, Jaeyoung Do

PDF

Universal Layout Emulation for Long-Term Database Archival

Raja Appuswamy, Vincent Joguin

PDF

Extended Abstracts

Accelerating Queries over Unstructured Data with ML

Daniel Kang

PDF

Hamming Tree: The Case for Memory-Aware Bit Flipping Reduction for NVM Indexing

Saeed Kargar, Faisal Nawab

PDF

Cloud Observability: A MELTing Pot for Petabytes of Heterogenous Time Series

Suman Karumuri, Franco Solleza, Stan Zdonik, Nesime Tatbul

PDF

DataSense: Display Agnostic Data Documentation

Poonam Kumari, Michael Brachmann, Oliver Kennedy, Su Feng, Boris Glavic

PDF

White-Box OLAP Performance Modeling for the Cloud

Maximilian Kuschewski, Viktor Leis

PDF

Automating State Management in Computational Notebooks

Stephen Macke

PDF

The Need for a New I/O Model

Tarikul Islam Papon, Manos Athanassoulis

PDF

Scaling Data Science does not mean Scaling Machines

Devin Petersohn

PDF

Data Cleaning in the Era of Data Science: Challenges and Opportunities

El Kindi Rezig

PDF

Using Deep Learning Models to Replace Large Materialized Views in Relational Database

Jia Zou

PDF