Gremlin:图遍历语言

Gremlin简介

Gremlin是Apache TinkerPop
框架下的图遍历语言。Gremlin是一种函数式数据流语言,能够使得用户采纳简单的模式表明复杂的特性图(property
graph)的遍历或询问。每个Gremlin遍历由一文山会海步骤(可能存在嵌套)组成,每一步都在数据流(data
stream)上执行一个原子操作。

Gremlin包括六个大旨的操作:

  • map-step
    对数码流中的目的举行转移;
  • filter-step
    对数码流中的对象就行过滤;
  • sideEffect-step
    对数码流举行总括总结;

以下是Gremlin在一部分现象中的具体应用:

  • 1.查找Gremlin朋友的恋人

    g.V().has("name","gremlin").
      out("knows").
      out("knows").
      values("name")
    
  • 2.招来这么些由两个对象一同成立的项目

    g.V().match(
      as("a").out("knows").as("b"),
      as("a").out("created").as("c"),
      as("b").out("created").as("c"),
      as("c").in("created").count().is(2)).
    select("c").by("name")
    
  • 3.付出Gremlin的装有上司,直至经理

    g.V().has("name","gremlin").
      repeat(in("manages")).
    until(has("title","ceo")).
      path().by("name")
    
  • 4.获取Gremlin合作者的头衔分布

    g.V().has("name","gremlin").as("a").
      out("created").in("created").
    where(neq("a")).
      groupCount().by("title")
    
  • 5.到手Gremlin购买产品的相干制品列表并排序

    g.V().has("name","gremlin").
      out("bought").aggregate("stash").
      in("bought").out("bought").
    where(not(within("stash"))).
      groupCount().order(local).by(values,decr)
    
  • 6.取得排行前十的中坚人物

    g.V().hasLabel("person").
      pageRank().
    by("friendRank").
    by(outE("knows")).
      order().by("friendRank",decr).
      limit(10)
    

Java
5从前实现多线程有二种实现格局:一种是延续Thread类;另一种是落实Runnable接口。

OLTP 和 OLAP遍历

  • 两遍编写,到处运行
    Gremlin遵守“三次编写,到处运行”的计划性法学。那意味不但有着的TinkerPop启用的图形系统都能履行Gremlin遍历,而且每个Gremlin遍历都可以被评估为实时数据库查询或批处理查询。(前者被叫作在线交易流程(OLTP),后者被称为在线分析流程(OLAP))。

  • 和谐多种图遍历
    这种普遍性是由Gremlin遍历机实现的。这种分布式、基于图形的虚拟机通晓什么协调多机器图遍历的实践。好处是,用户不需要学习数据库查询语言和域特定的BigData分析语言(例如SparkDSL,MapReduce等)。Gremlin是构建基于图的应用程序所必不可少的,其它所有都交给Gremlin遍历机处理。
    葡京在线开户 1

三种艺术都要透过重写run()方法来定义线程的表现,推荐应用后者,因为Java中的继承是单继承,一个类有一个父类,假如连续了Thread类就不可以再持续其他类了,显著使用Runnable接口更为灵活

命令式和注明式遍历

Gremlin遍历能够以命令式(程序式)情势,讲明性(描述性)格局编写,也能够蕴涵命令性和注解性的插花形式编写。

  • 命令式编写情势
    赢得Gremlin合作者的上级名字分布:

    g.V().has("name","gremlin").as("a").
      out("created").in("created").
    where(neq("a")).
      in("manages").
      groupCount().by("name")
    

    一个命令式的Gremlin遍历告诉运行器怎么样举办遍历中的每一步;然后,遍历器分裂到具备的“Gremlin”的合作方(去除Gremlin自己);下一步,遍历器走到“Gremlin”合作者的上级(managers),最后依照上级的名字举行总结分发。

之所以是命令式的Gremlin遍历,就是它总而言之地、程序化地报告遍历器“去那里,然后去这里”。

  • 讲明式编写情势
    以下使用注明式编写格局贯彻了一致的结果:

    g.V().match(
      as("a").has("name","gremlin"),
      as("a").out("created").as("b"),
      as("b").in("created").as("c"),
      as("c").in("manages").as("d"),
    where("a",neq("c"))).
      select("d").
      groupCount().by("name")
    

    讲明式的Gremlin遍历并不可能告诉遍历器执行它们的步子的各种,而是允许每个遍历器从一个(可能嵌套的)情势的成团中挑选一个情势来进行。

只是,表明遍历具有额外的利益,它不但使用了编译时查询计划器(如命令式遍历),而且依然一个周转时查询计划器,依照每个格局的历史总结信息选取下一个推行哪个遍历格局

  • 便宜这一个倾向于缩短/过滤大多数多少的形式。

用户可以采取上述指出的办法编写自己的遍历语句。不管如何,用户的遍历语句都会依照实际的举办引擎和遍历策略traversal
strategies
被重写。Gremlin为用户提供灵活性表明自己的询问的;图系统也针对具体启用TinkerPop的数据系统举办中用地评估图遍历提供了灵活性。

填补:Java
5将来创办线程还有第二种格局:实现Callable接口,该接口中的call方法能够在线程执行完毕时暴发一个再次回到值,代码如下所示:

无缝嵌入主语言

  • 合并主开发语言和图查询语言
    经文数据库查询语言(如SQL)被认为与终极在生育条件中应用的编程语言截然不同。由此,经典数据库要求开发人士既要编写主编程语言,还要编写数据库相应的查询语言。Gremlin统一了那多少个划分,因为遍历可以用辅助功用整合和嵌套(重要编程语言都襄助)的此外编程语言编写。由此,用户的Gremlin遍历可以采用应用程序语言(主语言,Host
    language)编写,并获益于主语言及其工具(例如类型检查,语法高亮,点成就等)所提供的优点。最近留存各个Gremlin语言变体,包括:Gremlin-Java,Gremlin-Groovy,Gremlin-Python,Gremlin-Scala等。

  • 以身作则程序
    正如之下二种方法,高低立判:

    public class GremlinTinkerPopExample {
      public void run(String name, String property) {
    
    Graph graph = GraphFactory.open(...);
    GraphTraversalSource g = graph.traversal();
    
    double avg = g.V().has("name",name).
                   out("knows").out("created").
                   values(property).mean().next();
    
    System.out.println("Average rating: " + avg);
      }
    }
    

public class SqlJdbcExample {
  public void run(String name, String property) {

    Connection connection = DriverManager.getConnection(...)
    Statement statement = connection.createStatement();
    ResultSet result = statement.executeQuery(
      "SELECT AVG(pr." + property + ") as AVERAGE FROM PERSONS p1" +
        "INNER JOIN KNOWS k ON k.person1 = p1.id " +
        "INNER JOIN PERSONS p2 ON p2.id = k.person2 " +
        "INNER JOIN CREATED c ON c.person = p2.id " +
        "INNER JOIN PROJECTS pr ON pr.id = c.project " +
          "WHERE p.name = '" + name + "');

    System.out.println("Average rating: " + result.next().getDouble("AVERAGE")
  }
}

 

参考资料

The Gremlin Graph Traversal Machine and
Language

import java.util.ArrayList;

 

import java.util.List;

 

import java.util.concurrent.Callable;

 

import java.util.concurrent.ExecutorService;

 

import java.util.concurrent.Executors;

 

import java.util.concurrent.Future;

 

 

 

class MyTask ``implements Callable<Integer> {

 

``private int upperBounds;

 

 

 

``public MyTask(``int upperBounds) {

 

``this``.upperBounds = upperBounds;

 

``}

 

 

 

``@Override

 

``public Integer call() ``throws Exception {

 

``int sum = ``0``;

 

``for``(``int i = ``1``; i <= upperBounds; i++) {

 

``sum += i;

 

``}

 

``return sum;

 

``}

 

 

 

}

 

 

 

class Test {

葡京在线开户, 

 

 

``public static void main(String[] args) ``throws
Exception {

 

``List<Future<Integer>> list = ``new ArrayList<>();

 

``ExecutorService service = Executors.newFixedThreadPool(``10``);

 

``for``(``int i = ``0``; i < ``10``; i++) {

 

``list.add(service.submit(``new
MyTask((``int``) (Math.random() * ``100``))));

 

``}

 

 

 

``int sum = ``0``;

 

``for``(Future<Integer> future : list) {

 

``// while(!future.isDone()) ;

 

``sum += future.get();

 

``}

 

 

 

``System.out.println(sum);

 

``}

 

}