]> git.somenet.org - pub/jan/adbs.git/blob - ex2/main_4.tex
ex4 weitergeschrieben.
[pub/jan/adbs.git] / ex2 / main_4.tex
1 %ex2.4
2
3 \begin{enumerate}[label=(\alph*)]
4         \item\textbf{Create a new database and create tables for all datasets listed above.}\\
5         
6         Running:
7         \begin{verbatim}rsync -vaPp --delete ~/gitstuff/adbs/ex2/hive/ \
8         e726236f@lbd.zserv.tuwien.ac.at:hive/; \
9         ssh -t e726236f@lbd.zserv.tuwien.ac.at "cd hive; hive"
10         \end{verbatim}
11         
12         once the hive-shell opens, use:
13         \begin{verbatim}source create.sql\end{verbatim}
14
15         Time taken: 31.799 seconds.
16         
17         \item\textbf{Explore how Partitions and Buckets affect joins.}\\
18         Running:
19         \begin{verbatim}rsync -vaPp --delete ~/gitstuff/adbs/ex2/hive/ \
20         e726236f@lbd.zserv.tuwien.ac.at:hive/; \
21         ssh -t e726236f@lbd.zserv.tuwien.ac.at "cd hive; hive"
22         \end{verbatim}
23         
24         once the hive-shell opens, use:
25         \begin{verbatim}source query.sql\end{verbatim}
26
27         Various experiments/attempts are documented in the \textbf{query.sql} file. 
28         You likely dont want to run that file without editing it first, as this will run all kinds of queries and it will take \textbf{really} long to complete.
29 \end{enumerate}